Gene Athe_0523 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_0523
Symbol
ID	7408647
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	589702
End bp	590874
Gene Length	1173 bp
Protein Length	390 aa
Translation table	11
GC content	37%
IMG OID	643714905
Product	Extracellular ligand-binding receptor
Protein accession	YP_002572422
Protein GI	222528540
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0215267
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAGAT TAACCTTAAA GAATCTGGTT GGTATTACGG TAGTTTTGGT TTTATTAATT 
TCTCTTTTTA CCAGTGCCGA ATCTTCAAAT ACAAAAACTA TTCGACTTGG TGTGAATCTT 
GAACTATCAG GCAGTGTTGC ACAGTTTGGG CAGAGAAATT TGGAAGGACT TAAAATGGCA 
ATTGAAGAAA TAAACAGCAA GGGTGGAGTT TTAGGCAAAA AAATTGAACT TGTGATTTAC 
GACAACAAAT CAGACAAGAC AGAAGCATTG AATGTTGCCA CAAAACTTGC TACAAAAGAA 
AATGTTTTTG CAATGTTAGG ACCAGTTACG TCAGGTGCAA CAAAATCAGC CTCTGTTGCT 
GCGCAGCGTT ATAAAGTACC TCTAATTTCT TCTACAGCAA CAGATGACCT TGTCACAGTA 
GATGAGCGAA CAGGTAGAAC AAAAGCGTAC ATTTTCAGAA TTTGTTTTAA TGACTCATTT 
CAGGGCAGTG TGATGGCAAA CTTTGCTCTA AAGACGTTAA AAATCAAAAC TGCAGCTGTG 
ATATACGATG CATCTTCGGA TTACAGCAAA GGTCTTTATA AGAATTTCAA AGAGGCATTT 
ACAAAAGGTG GAGGGAAGCT TGTAGCTGAA GAAGCATTTT CGAAAGGTGA ACAAGATTTT 
AATGGAATTT TGACAAAAAT AAGAGACAAA AAACCGCAAG CTATTTTTGC CCCTGTATAC 
TACGATGAAG CAGGACTTAT CATCAAACAG GCAAGAGAGC TTGGAATGTG GATACCTATT 
TTGGGTTCTG ACGGGTTTGA CGACCCGAAA GTTATAGAAA AAGCAGGCAG CAAATATGCA 
ACAAATGTAT TTTTCTCAAC ACATTATTCC TCTCAGGACA CAGATAAAAA AGTGCAGGAT 
TTTAGAAAAA GATACCAGCA AAAGTATAAG ATTGAACCTA ACGCGCTTTC AGCACTGGGT 
TATGATTTGG GTTATTTCAT TGCAGATGCA ATAAAAAGAG CGAATTCTAC AACAGACAGA 
GAAAAACTTC GCAAAGCACT TGAAATCACC AAGAACTTTG AGGGTGTTAC TGGAATTATC 
TCAATAGATG CAAAACATAA TGCAAAGAAG TCTGCGGTTA TAATCGAGAT AAAAAATGGT 
GTTCAGAGAT TTAAACAAAA ACTAAATCCT TAA

Protein sequence

MKRLTLKNLV GITVVLVLLI SLFTSAESSN TKTIRLGVNL ELSGSVAQFG QRNLEGLKMA 
IEEINSKGGV LGKKIELVIY DNKSDKTEAL NVATKLATKE NVFAMLGPVT SGATKSASVA 
AQRYKVPLIS STATDDLVTV DERTGRTKAY IFRICFNDSF QGSVMANFAL KTLKIKTAAV 
IYDASSDYSK GLYKNFKEAF TKGGGKLVAE EAFSKGEQDF NGILTKIRDK KPQAIFAPVY 
YDEAGLIIKQ ARELGMWIPI LGSDGFDDPK VIEKAGSKYA TNVFFSTHYS SQDTDKKVQD 
FRKRYQQKYK IEPNALSALG YDLGYFIADA IKRANSTTDR EKLRKALEIT KNFEGVTGII 
SIDAKHNAKK SAVIIEIKNG VQRFKQKLNP