Gene Xaut_1794 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Xaut_1794
Symbol
ID	5422160
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Xanthobacter autotrophicus Py2
Kingdom	Bacteria
Replicon accession	NC_009720
Strand	-
Start bp	2022636
End bp	2023577
Gene Length	942 bp
Protein Length	313 aa
Translation table	11
GC content	69%
IMG OID	640881042
Product	formylmethanofuran--tetrahydromethanopterin formyltransferase
Protein accession	YP_001416696
Protein GI	154245738
COG category	[C] Energy production and conversion
COG ID	[COG2037] Formylmethanofuran:tetrahydromethanopterin formyltransferase
TIGRFAM ID	[TIGR03119] formylmethanofuran--tetrahydromethanopterin N-formyltransferase

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.0427197
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	0.884171
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTTCCC AAGCCCCCAT GATCATCAAC GGCGTCGAGA TCCGCGACAG CTTCGCCGAG 
GCGTTCCCCA TGGCGGGAAC GCGCCTCATC ATAACCGCCG ATACACCGCG CTGGGCGCAT 
ACCGCCGCAG CGAGCCTCAC CGGCTTTGCC ACCTCGGTCA TCGGCTGCGG CTGCGAGGCG 
GCCATCGAGC GGCAGCTTGC CCCCGACGAG ACCCCGGACG GCCGGCCGGG CTATGCCGTG 
CTCATCTTCG CCATGTCCCT GAAGGATCTG AAGAAGGTGG TGCCGCTGCG GGCCGGGCAA 
TGCGTGCTCA CCTCGCCCAC CTCCGCCTGT TATTCGGGGC TGGAGGGCGG GGCCGCCATC 
GCGCTCGGGC GGGCGCTGCG CTATTTCGGC GACGGCTACC AGATCGCCAA GTCCATCGAC 
GGGCGCCGCT TCTGGCGCAT CCCGGTGATG GAGGGCGAGT TTGTCTGCGA CGAGGTGGTG 
GGCTCCACCA CCGCGGCCGT GGGCGGCGGC AACTTCCTCA TCCTCGCCCG CTCGCGCCCC 
GCCGCCCTCG CTGCCGCGGA AGCGGCGGTG GAGGCCATGG GGCAGGTGCG CGGCGCCATC 
ATGCCGTTTC CCGGCGGCGT GGTGCGCTCC GGCTCCAAGG TGGGCGCCAA ATATGCGGGC 
ATGATCGCCT CCACCAACGA CGCCTATTGC CCGACCCTGC GCGGCGTCTC TCAGAGCGCC 
CTGCCGCCGG AGGTGGAAAG CGTGCTCGAA ATCGTCATCG ACGGGTTGAG CGAGCAAGAC 
GTGGCCGCCA GCATGCAGGC GGGCATAACC GCCGTCTGCG GCCTTGGCGC CGCCGCCGGG 
GTGGTGGCGG TGGATGCCGG CAATTATGGC GGCAATCTCG GCCCCTTCCA TTTCAAGCTG 
CGCCAGTTGA TGGCTCCTGT CGCCGGGGAG ACAGTAGTAT GA

Protein sequence

MTSQAPMIIN GVEIRDSFAE AFPMAGTRLI ITADTPRWAH TAAASLTGFA TSVIGCGCEA 
AIERQLAPDE TPDGRPGYAV LIFAMSLKDL KKVVPLRAGQ CVLTSPTSAC YSGLEGGAAI 
ALGRALRYFG DGYQIAKSID GRRFWRIPVM EGEFVCDEVV GSTTAAVGGG NFLILARSRP 
AALAAAEAAV EAMGQVRGAI MPFPGGVVRS GSKVGAKYAG MIASTNDAYC PTLRGVSQSA 
LPPEVESVLE IVIDGLSEQD VAASMQAGIT AVCGLGAAAG VVAVDAGNYG GNLGPFHFKL 
RQLMAPVAGE TVV