Gene BAS4159 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	BAS4159
Symbol
ID	2851289
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Bacillus anthracis str. Sterne
Kingdom	Bacteria
Replicon accession	NC_005945
Strand	+
Start bp	4076096
End bp	4077259
Gene Length	1164 bp
Protein Length	387 aa
Translation table	11
GC content	39%
IMG OID	637507395
Product	cystathionine beta-lyase
Protein accession	YP_030408
Protein GI	49187156
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0626] Cystathionine beta-lyases/cystathionine gamma-synthases
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGTTATT CTATAGATAC ACTCTTACTA CACAACCAAT ATAAACATGA TCCACAAACA 
GGAGCTGTTA ACGTTCCCAT CTATAACACA TCAACATTCC ACCAGTTCGA TGTAGATACG 
TTCGGGAAAT ATGACTATAG CAGGTCAGGA AATCCAACTC GTGAAGCTCT TGAAGACATC 
ATTGCTTTAT TAGAAGGCGG AACGAAAGGA TTTGCCTTCG CATCAGGAAT TGCAGCGATT 
TCTACTGCAT TCCTCCTTCT TTCACAAGGT GATCACGTAC TCATTTCAGA AGACGTATAC 
GGAGGGACTT ATCGAATAAT AACTGAAGTT CTCTCCCGTT ATGGTGTTTC ACATACATTT 
GTTGATATGA CCAATCTAGA AGAAATCAAG CAAAATATAA AACAAAATAC AAAGCTCTTT 
TATGTAGAAA CACCTTCTAA CCCGCTTTTA AAAGTAACAG ATATTCGTGC TGTTTCTACA 
CTTGCAAAAT CTATTGGCGC TCTTACTTTT GTTGATAATA CATTTTTGAC ACCACTATTC 
CAGAAACCAC TTGATCTCGG CGCAGATGTC GTTCTTCATA GCGCTACAAA GTTCATTGCT 
GGTCACAGTG ATGTTACTGC TGGATTAGCG GTCGTAAAAG ATGCCGAACT TGCTCAAAAA 
CTTGGATTTT TACAAAATGC ATTCGGCGCC ATTTTAGGAC CTCAAGATTG CTCTCTCGTA 
CTTCGCGGTC TAAAAACATT ACATGTACGT CTTGAGCATT CAGCTGCGAA TGCCAATAAA 
ATTGCACAGT ATTTACAAGA GCACAGTAAA ATTCAAAATG TCTATTATCC TGGCTTACAA 
ACACATCTTG GATTTGATAT TCAACAATCT CAAGCAACAT CGGCCGGAGC TGTCCTATCC 
TTCACTTTAC AATCAGAAGA TGCACTCCGC CAATTTTTAT CAAAAGTAAA ATTACCTGTC 
TTTGCAGTTA GTTTAGGAGC TGTCGAATCG ATTCTTTCCT ATCCGGCTAA AATGTCACAT 
GCAGCACTGT CACAAGAAGC TCGTGATGAA AGAGGTATTT CCAATTCATT ACTTCGTTTA 
TCCGTCGGCC TTGAAAATGT TGATGATTTA ATATCCGACT TTGAAAATGC CCTTTCTTAT 
GTAGAAGAAC CTGTAAATGC ATAG

Protein sequence

MSYSIDTLLL HNQYKHDPQT GAVNVPIYNT STFHQFDVDT FGKYDYSRSG NPTREALEDI 
IALLEGGTKG FAFASGIAAI STAFLLLSQG DHVLISEDVY GGTYRIITEV LSRYGVSHTF 
VDMTNLEEIK QNIKQNTKLF YVETPSNPLL KVTDIRAVST LAKSIGALTF VDNTFLTPLF 
QKPLDLGADV VLHSATKFIA GHSDVTAGLA VVKDAELAQK LGFLQNAFGA ILGPQDCSLV 
LRGLKTLHVR LEHSAANANK IAQYLQEHSK IQNVYYPGLQ THLGFDIQQS QATSAGAVLS 
FTLQSEDALR QFLSKVKLPV FAVSLGAVES ILSYPAKMSH AALSQEARDE RGISNSLLRL 
SVGLENVDDL ISDFENALSY VEEPVNA