Gene Moth_0881 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Moth_0881
Symbol
ID	3831519
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Moorella thermoacetica ATCC 39073
Kingdom	Bacteria
Replicon accession	NC_007644
Strand	+
Start bp	910272
End bp	911357
Gene Length	1086 bp
Protein Length	361 aa
Translation table	11
GC content	63%
IMG OID	637828811
Product	carbamoyl-phosphate synthase small subunit
Protein accession	YP_429741
Protein GI	83589732
COG category	[E] Amino acid transport and metabolism [F] Nucleotide transport and metabolism
COG ID	[COG0505] Carbamoylphosphate synthase small subunit
TIGRFAM ID	[TIGR01368] carbamoyl-phosphate synthase, small subunit

Plasmid Coverage information

Num covering plasmid clones	43
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCCAGTGC GCGGGTTTTT GGTGCTGGAG GACGGAACGG TATATAGCGG CGAGGCCTTT 
GGTTACCCCG GCCGCTCTCA CGGGGAGGTC GTTTTCAATA CCAGCATGAC CGGTTATCAA 
GAGATCCTGA CCGACCCCTC CTATTGCGGC CAGATTGTAG CCCTGACCTA CCCCCTGATC 
GGCAACTACG GCATTAACGA TGAGGATCTC GAGTCGGATG GCCCCCGGGT AGCCGGCTTC 
GTCGTCCATG AAGCCTGCCC GCGGCCCAGC AACTGGCGGT CAACGGGTAG CCTTGATCAT 
TACCTCCGGG AAAACCGCAT CCCGGCCCTG CAAGGGGTGG ATACCCGCGC CCTCACAAGG 
CACCTGCGCC GACGGGGCAC CATGCGGGGC ATCCTGGCCA CGGGCGAGGT GGATTTGGAG 
GAAATCAAGG CCCTGGCCGC TACCCGGCCG GCCCTGAGCG GCGCCAAACT GGTACCGGCG 
GTTACCAATG CCAAGCCGTA TACCGTCGAG GGAGGGCCGC GCCGGGTAGT TCTCTATAAT 
TTCGGCGTCA AGGAGAATAT CATCCGCTGG CTGCGCCGGG AGGGATGCAC CGTTACCGTC 
ATGCCGGCCC GAAGTACAGC AGCCGCTATT CTGGCCCTCA ACCCCGAAGG GGTGGTCGTT 
TCCAATGGCC CGGGCGACCC CAAGGACGTT CCCTACGGTG TGGCCACCGT CCGGGAACTA 
CTGGGCCGGG TACCACTGAT GGGCATTTGC CTGGGCCACC AGCTCCTGGC TCTGGCCCTG 
GGAGGCGATA CCTACAAACT CCCCTTCGGC CACCGCGGCG GCAACCACCC GGTTAAGGAT 
TTAAGCACCG GTCGGGTCTA TATTACCTCC CAGAACCATG GTTACGCCGT CCGGGCTGAC 
TCCCTGCCGA CAGGGGCGGT CGTCTCCCAT ATCAACCTCA ACGACGGCAC GGTGGAAGGC 
CTGCGCCATC GGGAGTTGCC CGCCTTCTCC GTGCAGTATC ACCCCGAATC CTCGCCGGGA 
CCGACGGATT CCGAGTACCT CTTCCACGAA TTTATCAGGC TGGTAGACGA ACACCGGGGG 
CAATAA

Protein sequence

MPVRGFLVLE DGTVYSGEAF GYPGRSHGEV VFNTSMTGYQ EILTDPSYCG QIVALTYPLI 
GNYGINDEDL ESDGPRVAGF VVHEACPRPS NWRSTGSLDH YLRENRIPAL QGVDTRALTR 
HLRRRGTMRG ILATGEVDLE EIKALAATRP ALSGAKLVPA VTNAKPYTVE GGPRRVVLYN 
FGVKENIIRW LRREGCTVTV MPARSTAAAI LALNPEGVVV SNGPGDPKDV PYGVATVREL 
LGRVPLMGIC LGHQLLALAL GGDTYKLPFG HRGGNHPVKD LSTGRVYITS QNHGYAVRAD 
SLPTGAVVSH INLNDGTVEG LRHRELPAFS VQYHPESSPG PTDSEYLFHE FIRLVDEHRG 
Q