Gene Athe_2753 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Athe_2753
Symbol
ID	7408323
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anaerocellum thermophilum DSM 6725
Kingdom	Bacteria
Replicon accession	NC_012034
Strand	+
Start bp	2902907
End bp	2904052
Gene Length	1146 bp
Protein Length	381 aa
Translation table	11
GC content	34%
IMG OID	643717109
Product	phosphate binding protein
Protein accession	YP_002574578
Protein GI	222530696
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0226] ABC-type phosphate transport system, periplasmic component
TIGRFAM ID	[TIGR02136] phosphate binding protein

Plasmid Coverage information

Num covering plasmid clones	29
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAAAAG TATTCTTTAA AAAGGTTATT ACTCTAATAG CACTTTATTG CTTTATGTCA 
ACAATATGTT TAATCCCATT AATGTCCTAC TCACAAAGTC TAACAGTAAA GTCAAAATCA 
CTTCCCTCAT CAACAACACA AAAACAGATT ATTATTACAT TTTCACAGGA TATCTTAAAA 
GGTCCAAATT TTGATAAGAT AACACTTTTA AAAAACAAAA AATCAAAGGT ACAATTCTCA 
GCTCAGGTTT CATATAACAA GCTTGTCATA ACAATAAAAG AAAATCTTAC TCCAAAAGCT 
CAGTATCTAT TGACAATTCC AAAAAATGCT CTAAAGTCAG CTAAAGGAGA TTATAACCCA 
GAACTTAAGT ACACATTTAT TCCACAAACT TTTTCAACAA ACCTTTCTGG AAGAATTATG 
ATTGCAGGGT CAACATCTGT TCAGCCACTT GCTGATGAAC TTGCAAAATA TTTTATGCAG 
CAATATCCAA AAGTATCAAT TGAGGTTCAA GGTGGAGGCT CATCAGTGGG AATAAAATCT 
GCTATTCAAG GAATTGTAGA CATTGGAACA TCATCAAGAG AACTGACAGA GGATGAATCA 
AAACAGCTAT CAGCAAAAGG CTGGCAAGAG ATAAAAATTG CAGAAGATGG CATTGCAGTT 
ATTGTTCACA AATCCAATCC TGTGTCAAAC CTCTCAATTG AACAAATTAG AGACATATTC 
TCTGGCAAGA TTAAAAACTG GAAAGAGGTT GGCGGTAAAG ACGCTAAAAT AGTTGTTGTC 
ACAAGAGAAG AAGGTTCTGG TACAAGAGGC GCGTTTGAAG AAATAGTTAT GGGAAAATCA 
TCAAAGATAA CAGACTCAGC AATTGTCCAG CCATCAACTG GTGCTGTAAA AACAACAGTT 
TCACAGGATG AAAATGCAAT TGGATATATA TCAATTGGCG TATTAGATAG CACAGTAAAA 
GGTGTCAAGG TTGAAGGTGT TGAACCATCA GAAAAGAACG TAAAGCTCGG AAAATACAAA 
ATTAAAAGAC CATTTCTCTT CTTAGTTTCC AAAAATCCAA GCAAGGTAAC AAAAGCATTT 
GTTGATTTTG TCCTCTCTGA TGAAGGTCAG GCAATTGTAG CTAAAAACTA TATCTCAGTT 
AAGTAA

Protein sequence

MKKVFFKKVI TLIALYCFMS TICLIPLMSY SQSLTVKSKS LPSSTTQKQI IITFSQDILK 
GPNFDKITLL KNKKSKVQFS AQVSYNKLVI TIKENLTPKA QYLLTIPKNA LKSAKGDYNP 
ELKYTFIPQT FSTNLSGRIM IAGSTSVQPL ADELAKYFMQ QYPKVSIEVQ GGGSSVGIKS 
AIQGIVDIGT SSRELTEDES KQLSAKGWQE IKIAEDGIAV IVHKSNPVSN LSIEQIRDIF 
SGKIKNWKEV GGKDAKIVVV TREEGSGTRG AFEEIVMGKS SKITDSAIVQ PSTGAVKTTV 
SQDENAIGYI SIGVLDSTVK GVKVEGVEPS EKNVKLGKYK IKRPFLFLVS KNPSKVTKAF 
VDFVLSDEGQ AIVAKNYISV K