Gene BAS1959 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS1959
Symbol
ID	2851348
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	1965290
End bp	1966978
Gene Length	1689 bp
Protein Length	562 aa
Translation table	11
GC content	38%
IMG OID	637505209
Product	formate--tetrahydrofolate ligase
Protein accession	YP_028222
Protein GI	49184970
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG2759] Formyltetrahydrofolate synthetase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACAACTA CTACAACAGT TAAATCCGAT ATTGAAATCG CACAAGAAGC GAATATGAAA 
AAGATTCAAG AAATTGCAGC TGATTTAAAT ATTTTAGAAG ATGAATTAGA GCCATACGGG 
CATTATAAAG GTAAGTTATC TCTTGATATT TTTAAGCGCT TACAAAATGA GAAAGACGGT 
AAAGTTGTTT TAGTAACAGC GATTAACCCA ACTCCAGCTG GAGAAGGTAA ATCAACAGTA 
ACAGTTGGTT TAGGTCAAGC TTTTAATAAA ATTGGTAAGA AAACAGTAAT TGCACTTCGC 
GAACCATCTC TTGGACCAAC GATGGGGCTA AAAGGCGGAG CAGCAGGTGG TGGTTTTTCA 
CAGGTTGTAC CAATGGAAGA CATTAACCTT CACTTTACTG GAGATATCCA TGCGATCACA 
ACTGCTAATA ACGCGTTAGC CGCGTTTATT GATAATCATA TCCAACAAGG AAATACACTT 
GGAATTGATA CGCGTAAAAT CGTTTGGAAA CGTTGTGTTG ACTTAAATGA TCGTGCCCTT 
CGTAACGTAG TAATTGGTCT TGGTGGACCG GTTCAAGGTG TACCACGTGA AGACGGTTTT 
GATATTACAG TAGCATCTGA AATTATGGCC GTATTCTGCC TTGCGACAGA TATTCAAGAT 
TTAAAAGCAC GTCTATCACG CATCGTAGTT GCTTATAATT TTGCAAATCA ACCTGTAACG 
GTTAAAGATT TAGGTGTAGA AGGTGCGTTA ACATTATTAT TAAAAGATGC ATTAAAGCCA 
AACTTAGTGC AAACGTTAGA AAATACACCA GCTATCATTC ATGGCGGACC ATTTGCGAAT 
ATCGCTCATG GTTGTAACAG TGTTATCGCT ACAACAATGG CAGCAAAATT AGGTGATTAT 
GTTATTACAG AAGCTGGATT TGGTGCAGAT TTAGGTGCTG AGAAGTTTTT AGATATTAAA 
GCTCGTGCAG CTGGCATTAA ACCAGAAGCA GTTGTTATTG TTGCGACGAT TCGTGCGCTT 
AAAATGCATG GTGGCGTAGC AAAAGATCAA TTAAAAGAAG AAAATGTAGA TGCATTAGCA 
AAAGGTATGG AGAACTTACA GAAGCACGTT GAAACAATTC AAAGCTTCGG TGTGCCTTTC 
GTAATTGCAA TTAATAAATT CATTACAGAT ACAGATGCAG AAGTTGCATA CTTACAAGAA 
TGGTGTAATG AGCGTGGCTA TGCGGTATCC TTAACAGAAG TTTGGGAAAA AGGTGGCCAA 
GGCGGAGTTG ACCTTGCTGA AAAAGTGTTA AAAGAAATTG AAAAAGGTGA AAACAACTAC 
GCACCACTTT ATGAATTAGA ATTACCATTA GAAGAGAAAA TTCGTACAAT TGCTCAAAAA 
GTGTATGGCG CAAAAGACAT TGAATTTGCT CCGAAAGCAC GTAAGCAATT AGCTCAATAT 
GAAGGCGAAG GTTGGAGTAA CCTACCAATT TGTATGGCGA AAACACAATA CTCTCTTTCT 
GACGATGCAA CGAAATTAGG TCGTCCATCT GACTTTATCG TTACAATTCG TGAGCTAAAA 
CCATCTATTG GTGCAGGCTT TATCGTTGCG TTAACAGGAA CAATGTTAAC AATGCCAGGC 
CTTCCAAAAC AACCAGCAGC ACTACAAATG GATGTAAATG AAGATGGAAA AGCAGTAGGT 
TTATTCTAA

Protein sequence

MTTTTTVKSD IEIAQEANMK KIQEIAADLN ILEDELEPYG HYKGKLSLDI FKRLQNEKDG 
KVVLVTAINP TPAGEGKSTV TVGLGQAFNK IGKKTVIALR EPSLGPTMGL KGGAAGGGFS 
QVVPMEDINL HFTGDIHAIT TANNALAAFI DNHIQQGNTL GIDTRKIVWK RCVDLNDRAL 
RNVVIGLGGP VQGVPREDGF DITVASEIMA VFCLATDIQD LKARLSRIVV AYNFANQPVT 
VKDLGVEGAL TLLLKDALKP NLVQTLENTP AIIHGGPFAN IAHGCNSVIA TTMAAKLGDY 
VITEAGFGAD LGAEKFLDIK ARAAGIKPEA VVIVATIRAL KMHGGVAKDQ LKEENVDALA 
KGMENLQKHV ETIQSFGVPF VIAINKFITD TDAEVAYLQE WCNERGYAVS LTEVWEKGGQ 
GGVDLAEKVL KEIEKGENNY APLYELELPL EEKIRTIAQK VYGAKDIEFA PKARKQLAQY 
EGEGWSNLPI CMAKTQYSLS DDATKLGRPS DFIVTIRELK PSIGAGFIVA LTGTMLTMPG 
LPKQPAALQM DVNEDGKAVG LF