Gene Nmul_A1909 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Nmul_A1909
Symbol
ID	3784147
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Nitrosospira multiformis ATCC 25196
Kingdom	Bacteria
Replicon accession	NC_007614
Strand	-
Start bp	2199174
End bp	2200502
Gene Length	1329 bp
Protein Length	442 aa
Translation table	11
GC content	57%
IMG OID	637811995
Product	FolC bifunctional protein
Protein accession	YP_412596
Protein GI	82703030
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0285] Folylpolyglutamate synthase
TIGRFAM ID	[TIGR01499] folylpolyglutamate synthase/dihydrofolate synthase

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCACTT TCTCCTTTGC TTCCGCAACG CTGCCAGAGT GGCTGGACTA CCTGGAACGC 
CTGCATCCCG CAGCTATCGA AATGGGACTG GAGCGGATAC GGCGCGTCCA GGCGGAACTG 
GAGCTCGAAC CTTCATTTCC CATCATTTCC GTTGCGGGCA CCAACGGGAA GGGATCGACA 
TGCATGATGC TGGAAGCCAT TCTGAGCCAT GCCGGATATC GGGTCGGATG CTATACCTCC 
CCTCATTTGC TGCGATATAA CGAACGCGTG CGAATCGACC GGAAGGAGGC AAGCGATGAT 
GAGCTGTGCG AGGCTTTCCG CGCTGTCGAA TCGGCGCGGA TGAATAGCGC CGTATCCCTG 
ACCTATTTCG AGTTTGGCAC ACTGGCCGCC ATGTACTTGT TCAGTCAGGC CGAAGTGGAA 
GTTGCAATTC TGGAGGTGGG ATTGGGCGGG CGGCTGGATG CGGTCAATGT GTTCGAGGCC 
GATTGCGCGG TCCTTACCAG CGTGGATTTC GATCATATGG ATTATCTGGG CAATACGCGT 
GAACAGATCG GATTCGAAAA GGCCGGAATT TTCAGGTCAG GGAAGGCCGC AATCTGTTCC 
GAACCGGACC TGCCCATAAG CGTGCGTCGT CATGCGGAAT CGATCGGCGC CGACCTCATG 
CATATCGGAG AGCACTTCGG TTATTCAACC GCTCCACAGT CCTGGAGCTA TTGGCGGAAC 
GGCGAGAGCA GGCATGCACT CCCTTATCCG GCCTTGCGCG GCGCCTATCA GTTGAAAAAT 
GCCAGTGCGT GCCTCGCCGC CCTGGATTCC CTGAAAGATA CATTGCCGGT TACCTTGAGC 
GACATTCGTC ATGGTTTGCT GGAAGTGGTT TGGCCAGCCC GGTTTCAGGT GTTGCCTGGA 
CAGCCGGTCA GGGTGCTCGA TGTTGCCCAT AATCCAGGCG CGGCACGCGC ATTGGCCGCC 
AGCCTCGATA GCATGGGGCG TTATCCCAGA ACGTACGCGG TATTTGCAAT GCTCGGGGAT 
AAAGATATCG CAGGCGTGGT ACGGGAGTTG AGGTCCAGCG TGGATGTCTG GCTGGTATCG 
GGTATTGACG CTCCAAGAGG CGCTACGGCG GACGAAGCCG CCACGCAGGT TGCCCAGGCG 
CTGCAAATCG CCGAGCCGCT CCCGGGGAAT GCAGGAGAAG GCGCCGCCCA TACCATCCGC 
AAGTTCCGCA ATCCATCCGA GGCATATGCT TACGCCTGTG AGCAGGCAGC CAGAAATGAT 
AGAATTTGTG TTTTCGGCTC ATTCCATACC GTGGCTGAAG TGTTAAGGAA CAGAATTGAG 
CGCGGGTAG

Protein sequence

MSTFSFASAT LPEWLDYLER LHPAAIEMGL ERIRRVQAEL ELEPSFPIIS VAGTNGKGST 
CMMLEAILSH AGYRVGCYTS PHLLRYNERV RIDRKEASDD ELCEAFRAVE SARMNSAVSL 
TYFEFGTLAA MYLFSQAEVE VAILEVGLGG RLDAVNVFEA DCAVLTSVDF DHMDYLGNTR 
EQIGFEKAGI FRSGKAAICS EPDLPISVRR HAESIGADLM HIGEHFGYST APQSWSYWRN 
GESRHALPYP ALRGAYQLKN ASACLAALDS LKDTLPVTLS DIRHGLLEVV WPARFQVLPG 
QPVRVLDVAH NPGAARALAA SLDSMGRYPR TYAVFAMLGD KDIAGVVREL RSSVDVWLVS 
GIDAPRGATA DEAATQVAQA LQIAEPLPGN AGEGAAHTIR KFRNPSEAYA YACEQAARND 
RICVFGSFHT VAEVLRNRIE RG