Gene GBAA_pXO1_0199 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_pXO1_0199
Symbol
ID	2820241
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007322
Strand	+
Start bp	166698
End bp	167747
Gene Length	1050 bp
Protein Length	349 aa
Translation table	11
GC content	33%
IMG OID	637682862
Product	hypothetical protein
Protein accession	YP_022460
Protein GI	47566508
COG category	[S] Function unknown
COG ID	[COG2357] Uncharacterized protein conserved in bacteria
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	1.3269600000000002e-32
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGCAATTAA ATCAGCAAGA GTTTTTTGAA ACATATAACA TAGATACACA AGAGTTTGAG 
ACTGCAGAAA TTAGTTGGAA TAGTTTATTA GAGATACATA GTGATTACTT ATCCTATAAA 
GAAACATTAA TTCCTACAGC AGAACATTTA TCAATGATGT TGCGTACTCA CCCAGCATCT 
CATACTGTTA GGTCTAGGGT TAAAGATGCT GGGCACTTAA TTGATAAAAT TATTAGAAAA 
ACTATTAGAG AAAAGGAGAA AAATCCTGAT TATTACATCG ACGTTAATAA TTATAAATCA 
GAGATTACAG ATTTAATTGG AATTAGAGTT CTGCACCTTT ACAAAGACCA AGCAGCTCCT 
ATTGATAAAT TTATCCGTGA TACTTGGGAT TTAAGGGAAA AATGTACCAT CTACTACCGT 
CAAGGTGATT ACTCAAAACA AGAAGAACCT AAAAATAATG ATTTATTTAA TTTCAAGGTA 
CATCCATTTG GCTATCGTTC ATGGCACTAT TTAATCAGTT CGCAAGCAAC AAAAAACGTT 
CACATTGCAG AAATTCAGGT AAGAACAATT TTTGAAGAAG GTTGGAGTGA AATTGACCAT 
CAGCTAAGAT ATCCTAATAA TATGAACGAC GTCCAGCTAA CTAAGCAGCT ATTAGTTTTA 
AATAGAGTTG CTGGAAGTGC TGACGAAATG GCGACTGTAA TCAGAGAATT AGTTGCTGAA 
AATAATATAA AACAAAAATC TATTGATGAA TTAAAAACAC AGCTTGACAC ATTGATGAAG 
GAAAATAATA TTGAAAAAGC TGTTAAAGAA AAATTCCAGA AGAAAGTTGA AGAGCTTCAA 
GATCAACTGG CACTTAAATT ACCAAATAAT AGATGGTTTA ATACACCTAT ATATTTGGGA 
GAAGGACCAA CGCCCGCTTC ATCCCCCCTA CTTAAAGCCG GCGAACAATT TGTTATTGAT 
TTTAAAGCAG ATGAGCCATA TGACATTAAG CGATATTTAA GTGGTTATAC ACATCCTGCA 
CTCATTAAAA AAGCAGATCC ACAGAAATAA

Protein sequence

MQLNQQEFFE TYNIDTQEFE TAEISWNSLL EIHSDYLSYK ETLIPTAEHL SMMLRTHPAS 
HTVRSRVKDA GHLIDKIIRK TIREKEKNPD YYIDVNNYKS EITDLIGIRV LHLYKDQAAP 
IDKFIRDTWD LREKCTIYYR QGDYSKQEEP KNNDLFNFKV HPFGYRSWHY LISSQATKNV 
HIAEIQVRTI FEEGWSEIDH QLRYPNNMND VQLTKQLLVL NRVAGSADEM ATVIRELVAE 
NNIKQKSIDE LKTQLDTLMK ENNIEKAVKE KFQKKVEELQ DQLALKLPNN RWFNTPIYLG 
EGPTPASSPL LKAGEQFVID FKADEPYDIK RYLSGYTHPA LIKKADPQK