Gene GBAA_3037 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	GBAA_3037
Symbol
ID	2817544
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. 'Ames Ancestor'
Kingdom	Bacteria
Replicon accession	NC_007530
Strand	-
Start bp	2801726
End bp	2802835
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	33%
IMG OID	637789839
Product	hypothetical protein
Protein accession	YP_019678
Protein GI	47528329
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.384014
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAATCAAC AGCTTGTGTA TACACCATTA GCGGAGCCTT TCGTAATGGG AGTTATGTCA 
GTTGTAGCTG TTATTTTATG CGTATTTTCA AGCAATCTAC TGTTTTTATC TCTCGTATTT 
TTGTATGTAA TTTTAATAGG TGCTATGCAT GTATACATAC GTAAAGTATC TCGTGTTGAA 
TGGGAATATA GCCAAGGGAA TTCAAACGTT TTTATAGGTG AAACGAATAT GTGCAAAATG 
AAAATTTCAA ATAAGTCGAT ATTTCCTATT TTCAATATCG TATTTCGATT TAAATGTGAA 
AACAAGCTAA CTTGGAATCA TGATGAAATA AACAAAAATA CGAATACAGG TTCAAATTAT 
TATATGAATT TTAATTTAAA AGGAGGAGAG TCAGCTTCAT TTCATTTACA AGCTGTAGCG 
TTAAAAAGAG GAATTGCGAA ATGGGAAGAA GTTGAAATTG TTATTACGGA TCCTTTTGGA 
TTTATAACGA ATCATATAAC ATATAAACAA GTCGATACGC CGTCCTATTT AGTTTTACCA 
GCTGTTCCAA AAATGCAAGT CCCTGAATTA CAAGAATGGT CACGAGGATT TCGAAAAGCG 
ATGTCTTCAC CCTTATATGA TGAAACGAAA GTAATGGGAG TGAAGTCTTA TGAAAATGAA 
GATTTTCGTT CCATCCACTG GAGTGCAACA GCGAAAACAG GGACGATAAC TGCGAAAAAG 
TATGAGCGAA CGCAATCAGA TAAATACGCG ATTTATCTCA ACTTGCAAAA TAAAAGTGGC 
GTTTCATTGC GAAATGATAT AGAAGAATTA ATTGAATTAA CAGCAGGCAT ATGTAAACAA 
CTTCTTATGC AAAACTGTTC ATTTGAATTA TGGATTAATA GTGTAAAGGA TAACGGTTTG 
CTACATGTAA AGAATGGTGA TAATCGGAAA CATTTGCAAA ATGTATTAAA AATACTTGCC 
TCAATATCGG ATCAAGATAC GCCTGTATCT TCTTCTTATT TTTACACAGC AGGCTTTCGT 
CGTAAGGAAC TGGATGCGGT TCCTTTAATT CTTGGTACTT CACCAAAGAA ATATAGTAGA 
ACAAATAAAT GGATTGTAAT GAAAGAATAA

Protein sequence

MNQQLVYTPL AEPFVMGVMS VVAVILCVFS SNLLFLSLVF LYVILIGAMH VYIRKVSRVE 
WEYSQGNSNV FIGETNMCKM KISNKSIFPI FNIVFRFKCE NKLTWNHDEI NKNTNTGSNY 
YMNFNLKGGE SASFHLQAVA LKRGIAKWEE VEIVITDPFG FITNHITYKQ VDTPSYLVLP 
AVPKMQVPEL QEWSRGFRKA MSSPLYDETK VMGVKSYENE DFRSIHWSAT AKTGTITAKK 
YERTQSDKYA IYLNLQNKSG VSLRNDIEEL IELTAGICKQ LLMQNCSFEL WINSVKDNGL 
LHVKNGDNRK HLQNVLKILA SISDQDTPVS SSYFYTAGFR RKELDAVPLI LGTSPKKYSR 
TNKWIVMKE