Gene Bind_1654 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Bind_1654
Symbol
ID	6200473
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Beijerinckia indica subsp. indica ATCC 9039
Kingdom	Bacteria
Replicon accession	NC_010581
Strand	-
Start bp	1870025
End bp	1871692
Gene Length	1668 bp
Protein Length	555 aa
Translation table	11
GC content	60%
IMG OID	641705645
Product	formate--tetrahydrofolate ligase
Protein accession	YP_001832774
Protein GI	182678628
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2759] Formyltetrahydrofolate synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.0498666
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCAGTG ATCTGGAAAT TGCCCGCGCC GCGAAACTTC GGCCGATTGC CACCGTCGCC 
GACGAGGCCA AGATTCCAGC CGAGGCGTTG CATTCCTATG GCCTGCATGT GGCCAAGATC 
GACACGAGCC TGTTGCCGAA AAAGGACCGC CCGGCCAAGC TAGTCCTTGT GACCGCCATC 
AATCCGACCC CGGCGGGCGA GGGCAAGACA ACCACCACAA TCGGACTCGG TGATGCCTTG 
CGCCGTCTCG GCAAGGCTTG TGTCATCGCT TTGCGTGAAC CTTCGCTTGG TCCCTGTTTT 
GGGACCAAAG GGGGGGCCAC GGGCGGCGGT TACGCGCAGA TCGTGCCGAT GGAACGCATC 
AATCTGCATC TCACCGGCGA TTTCCACGCG ATCACCAGCG CGCATAATCT CCTCGCCGCC 
TTGATCGACA ATCATCTTTA CTGGGGCGCC GAGCCCAAAA TCGATTCCCG CAAAGTCGCG 
TGGCGTCGCG TGCTCGACAT GAACGACCGT GCCTTGCGTC AAATCGTGGT CGGTCTGGGG 
GGAGGGGGCA ATGGCTACCC CCGTGAAACA GGTTTCGACA TTACCGCCGC TTCCGAGATT 
ATGGCGATCT TCTGCCTTTC GAAAGATCTC GCGGATCTGC AACAAAGGCT CGCACAAATC 
ATCGTCGCGC AGGATGTCAA CAAACAGCCC GTGCGTGCTG ATGCGTTGCA GGCCGTCGGC 
GCCATGACAG TCCTGCTCAA GGACGCGCTC ATGCCCAATC TGGTGCAAAC GCTCGAAGGC 
ACGCCCACTT TCGTTCATGG CGGTCCCTTT GCCAATATTG CCCATGGCTG CAATTCAGTG 
GCGGCGACGC TGGCCGCCAT GCAACTTGGC GATTACGTCG TGACGGAAGC AGGCTTCGGC 
GCCGATTTGG GGGCCGAGAA ATTTCTGGAC ATCAAATGCC GCCAGGCGGG GATCGCGCCC 
TCCGCGGCGG TGATCGTTGC GACGGCCCGT GCCTTGAAAT CGCATGGCGG TGTCGCTCCG 
GCCGATCTCA ATAAGGAAAA TCTCGACGCC CTCAAGGCGG GCCTCGCCAA TCTCGGGCGC 
CATATCGCCA ATGTCAAAAA GTTCGGGCTG CCGGTTGTCG TGGCGATCAA TCATTTCCTT 
TCGGATACAG AGGCGGAACA GGAACTGATT GCGCATACAT GCCGCGATGA ATACGGGGTC 
GAGGCGATTG ATTGCCGGCA TTGGGCGGCC GGTGGCAAGG GCGCCCTGGC GCTGGCTGAA 
AAGGTGATCG CCTTGGTCGA GGGTGGCACG GCCCAATTCA AGATGCTGTA TGAAGATACT 
TTGCCACTCA TTGAGAAAAT GCGCCGCATC GCGCAGGAAA TCTATGGCGC AGCGGATATT 
TCCCTGGACG CAAAGGCCAA GAAACAGCTT GCCGATATTG AGGCGCAGGG GTTCGGTCAT 
TTCCCGGTCT GTGTCGCGAA AACCCAATAT TCCTTCGCTG CCGATCCGAA ACTACTCGGC 
GCGCCAACGG GCCATATCGT ACCCATTCGC GAAGTCCGGC TCTCCGCCGG GGCCGGCTTC 
GTCGTGATGA TCTGCGGTGA CATCATGACC ATGCCGGGGC TCTCCCGCCA GCCAGCGGCC 
TGGAAGATCG GCCTCGATGC GCAAGGTAAT ATTGAAGGGC TGTTTTAA

Protein sequence

MSSDLEIARA AKLRPIATVA DEAKIPAEAL HSYGLHVAKI DTSLLPKKDR PAKLVLVTAI 
NPTPAGEGKT TTTIGLGDAL RRLGKACVIA LREPSLGPCF GTKGGATGGG YAQIVPMERI 
NLHLTGDFHA ITSAHNLLAA LIDNHLYWGA EPKIDSRKVA WRRVLDMNDR ALRQIVVGLG 
GGGNGYPRET GFDITAASEI MAIFCLSKDL ADLQQRLAQI IVAQDVNKQP VRADALQAVG 
AMTVLLKDAL MPNLVQTLEG TPTFVHGGPF ANIAHGCNSV AATLAAMQLG DYVVTEAGFG 
ADLGAEKFLD IKCRQAGIAP SAAVIVATAR ALKSHGGVAP ADLNKENLDA LKAGLANLGR 
HIANVKKFGL PVVVAINHFL SDTEAEQELI AHTCRDEYGV EAIDCRHWAA GGKGALALAE 
KVIALVEGGT AQFKMLYEDT LPLIEKMRRI AQEIYGAADI SLDAKAKKQL ADIEAQGFGH 
FPVCVAKTQY SFAADPKLLG APTGHIVPIR EVRLSAGAGF VVMICGDIMT MPGLSRQPAA 
WKIGLDAQGN IEGLF