Gene BAS4844 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4844
Symbol
ID	2848968
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	-
Start bp	4728543
End bp	4729799
Gene Length	1257 bp
Protein Length	418 aa
Translation table	11
GC content	40%
IMG OID	637508102
Product	hypothetical protein
Protein accession	YP_031087
Protein GI	49187834
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0737] 5'-nucleotidase/2',3'-cyclic phosphodiesterase and related esterases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGATCGTT TTCATAGTAT TTCGGAAGCG ACGAATGGAC TTGGCAATAC GAAGCTTTTA 
AATGAGGCGT TATATGATTA TGTAACGATC GGAAATAATG AAGGAATTAC GTTAGCGAAG 
GAGCATTTGA ATCATCTATA TGATGATGCT GAATTTGAGG TGCTCGTTGC GAATTTATTT 
GAAAAAGAAG GGGTACGTCC AGAGTGGGCG AAGCCTTATA AATTACATAC AACGACAGAT 
GGGATTACGA TTGCTTTTAT CGGATTAACA GTTGCGTATC CAGAGTTTTA TCAAATGTTA 
GATTGGCATA TTGAAGATCC AATCGAGCAT TTAGAGTCTA TTTTAGAAGA AGTGAGAGAT 
GAGGCTCATA TAACGGTTGT CCTTTCTCAT CTTGGAAAAA GTATGGATGA GCATATGGCG 
GAGCATTATG ATATAGATGT GATTTTAGGG GCACATACGC ATCATTTATT TGAGCGCGGT 
GTTCTTATGA ATAATACGTT ACTTTGTTGT TGTGAAAAGT GGGGACGTTA TGTTGGGCAC 
GTCCAGCTTA CTGTGGATAA AAAGACGAAG AAGCTGTTGA AAAAGGACGG TAGAGCGATT 
AAGACAGACC GTTTAGGTGC TTATAGTAAA CCGTTATCCA CAATTGAAGC GCTGCAGGAA 
GAAAGTACAC ATATTATGGA AGAACCTGTC GTTCATTTGA AGGAATCATT ACCGGTTGAT 
TGGTTTCATG AGACAGCATT TTCGCACATG TTAGCAAATG CGCTGAAAAC GTGGTGCGGT 
GCAGAGATTG GCATGGTGAA CGCTGGTGTA CTTCTTGAAG GATTAGATGA AGGTGTTGTG 
ACGCGCGGAG ATATTCACAG AATTTGTCCA CATCCAATTA ATCCATGTTT ATTAAAGGTG 
CCGGGGAAAA CGCTAAGAGA AGTTATTTTA AAGGCACGTC GCCCGAATAT GGAGAACCTT 
GAGGTAAAAG GATTCGGATT TCGCGGGAAA GTGATGGGGA AAATGATTTA CGCTGGTGTA 
GAAGTCATTC CAGATACGAT TCCCGGGAAT AAAATTTTAC TCGAAGATGT ATTAATTAAC 
GGAGAATCGC TGGAATTAGA TCGTATATAT ACAGTAGGAA CGATTGATAT GTTTACATTT 
GGCTACTTAT ACCCAGAGCT ATCCACACTT TCTAACAAAC AATATTATAT GCCAGAACTA 
CTTAGAGATG TGTTAACGGA CGTGTTAATA ACTCATACAT CTTCTGTCAA ACTATAG

Protein sequence

MDRFHSISEA TNGLGNTKLL NEALYDYVTI GNNEGITLAK EHLNHLYDDA EFEVLVANLF 
EKEGVRPEWA KPYKLHTTTD GITIAFIGLT VAYPEFYQML DWHIEDPIEH LESILEEVRD 
EAHITVVLSH LGKSMDEHMA EHYDIDVILG AHTHHLFERG VLMNNTLLCC CEKWGRYVGH 
VQLTVDKKTK KLLKKDGRAI KTDRLGAYSK PLSTIEALQE ESTHIMEEPV VHLKESLPVD 
WFHETAFSHM LANALKTWCG AEIGMVNAGV LLEGLDEGVV TRGDIHRICP HPINPCLLKV 
PGKTLREVIL KARRPNMENL EVKGFGFRGK VMGKMIYAGV EVIPDTIPGN KILLEDVLIN 
GESLELDRIY TVGTIDMFTF GYLYPELSTL SNKQYYMPEL LRDVLTDVLI THTSSVKL