Gene Nmul_A0752 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A0752
Symbol
ID	3786487
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	+
Start bp	875181
End bp	876371
Gene Length	1191 bp
Protein Length	396 aa
Translation table	11
GC content	59%
IMG OID	637810837
Product	elongation factor Tu
Protein accession	YP_411451
Protein GI	82701885
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0050] GTPases - translation elongation factors
TIGRFAM ID	[TIGR00231] small GTP-binding protein domain [TIGR00485] translation elongation factor TU

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.993523
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCAAAGA GCAAATTTGA GCGGACGAAG CCGCACATCA ACGTAGGGAC GATAGGTCAC 
GTGGACCATG GGAAGACCAC GTTGACGGCG GCGATCACGA TGGTATTGGC GAAGAAGTTT 
GGTGGGGAAG CGAAGAGTTA CGCACAGATA GACTCGGCGC CTGAAGAGAA GGCGCGGGGC 
ATCACGATCA ATACCTCGCA CGTGGAGTAC GAGACGGAGA AGCGGCATTA CGCGCACGTT 
GACTGTCCTG GTCACGCGGA CTATGTGAAG AACATGATCA CGGGTGCGGC GCAGATGGAC 
GGTGCGATTC TGGTGGTTTC GGCGGCGGAT GGACCGATGC CGCAGACGCG GGAGCACATT 
CTTCTGGCGC GGCAGGTAGG GGTTCCCTAC ATTATTGTCT ACATGAACAA GGCGGACATG 
GTGGACGATG CGGAACTTCT GGAGCTGGTG GAAATGGAAG TGCGGGAGCT GTTGTCCAAA 
TACAACTTTC CGGGAGATGA CACCCCGATA GTGATCGGTT CTGCACTGAA GGCGCTGGAA 
GGCGATCAGA GCGACATAGG GGAGCCCTCC ATCTACAAGC TTGCGGCGGC GCTGGACAGC 
TACATTCCGG AGCCCCAGCG GGCGGTGGAC GGGGCATTTC TGATGCCGGT CGAAGACGTT 
TTTTCCATAT CGGGTCGTGG CACGGTGGTG ACGGGTCGGG TTGAGCGTGG CGTGATCAAG 
GTGGGGGAAG ACATCGAGAT CGTGGGATTG AAGCCCACCA CCAAGACGGT GTGCACGGGT 
GTGGAGATGT TTCGCAAGCT TCTGGACCAG GGGCAGGCGG GAGACAACGT GGGCGTATTG 
CTGCGGGGCA CCAAGCGCGA GGAAGTGGAG CGTGGCCAGG TGCTGGCCAA GCCCGGGACC 
ATCACTCCTC ATACCAAGTT CACAGCCGAG ATTTACGTTC TGAGCAAGGA AGAGGGCGGG 
CGTCATACTC CCTTTTTCCA GGGGTACCGG CCGCAGTTTT ACTTCCGCAC GACGGATGTG 
ACGGGTGCAA TCGAGTTGCC TGCGGGCACG GAGATGGTGA TGCCCGGGGA CAATGTGTCG 
GTGACGGTAA ACCTGATTGC GCCGATTGCG ATGGAAGAAG GTCTGCGTTT TGCGATTCGT 
GAAGGCGGCA GGACCGTGGG CGCAGGCGTC GTGGCAAAAA TTATCGAATA G

Protein sequence

MAKSKFERTK PHINVGTIGH VDHGKTTLTA AITMVLAKKF GGEAKSYAQI DSAPEEKARG 
ITINTSHVEY ETEKRHYAHV DCPGHADYVK NMITGAAQMD GAILVVSAAD GPMPQTREHI 
LLARQVGVPY IIVYMNKADM VDDAELLELV EMEVRELLSK YNFPGDDTPI VIGSALKALE 
GDQSDIGEPS IYKLAAALDS YIPEPQRAVD GAFLMPVEDV FSISGRGTVV TGRVERGVIK 
VGEDIEIVGL KPTTKTVCTG VEMFRKLLDQ GQAGDNVGVL LRGTKREEVE RGQVLAKPGT 
ITPHTKFTAE IYVLSKEEGG RHTPFFQGYR PQFYFRTTDV TGAIELPAGT EMVMPGDNVS 
VTVNLIAPIA MEEGLRFAIR EGGRTVGAGV VAKIIE