Gene Acry_2216 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acry_2216
Symbol
ID	5160148
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Acidiphilium cryptum JF-5
Kingdom	Bacteria
Replicon accession	NC_009484
Strand	-
Start bp	2449820
End bp	2450857
Gene Length	1038 bp
Protein Length	345 aa
Translation table	11
GC content	62%
IMG OID	640554138
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_001235333
Protein GI	148261206
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	2
Plasmid unclonability p-value	0.000045016
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGATGATTT TCAGGAGCGC TTCGGCGCTT GGCGCGATGG CGGCCGTCTT GAGCTTCGTG 
GGAGTCGCGC GGGCGGCGCC GGCCCTGGAT ACGGCAAAAA TGACCCAGAT GCAGTCGAAG 
GCGGTGTGCG TGAATCCGCA CCCTACGCAT GTCAATTTGT CGAAGCTCGT AGTCGGATTC 
AGCCAGTCTG AATCGAATGC CAATCCGTTC CGAGCCGGTG AGACCAAGTC GGTCCGGGAT 
GCGGCGAAAG CGTTTCATGT CCGCCGGCTG ATCTATACAA ACGCGCATAG CAACCAGTCG 
CGCCAGGTCG CCGATGTCGA GAACATGATC AACCAAGGCG CGCAGGCGCT GATCATCGCG 
CCGCTGGATT CGACCGGCTT GCAACCGGCT TTCGCGCAGG CCGCAGCCAA GCACATTCCC 
ATCCTCACCC TCGACCGGCG GACCGCGGGC TCGAAGTGCA GCGATTATCT GAGCTTCCTG 
GGCTCCAACT TCTATTTCAA GCAAGGCGAG ATCGACGCGC GAGAACTAGC GAAGGCGACC 
GGCGGCCACG CGATGGTGGC GGAGATTCAG GGCGCCTACG GCAATTCGGT GGAGGTGGCG 
CGCACCAAGG GCTTCGCCGC TGGGCTCAAA GCCTATCCTG GCATGAAGAT CGTCACCGAG 
CAGACCGGTA ACTGGTTCAC CACCGACGCG CAGAAGGTGA TGAGCCAGAT TCTGCTCGCG 
CATCCGAATG TGAATGCGGT CTATGCCCAA GCGGATACGA TGGCGTTCGG CGCGATCACC 
GCGCTGCGCG ACGCCGGCAA GAAGCCGGGA CAGGTCAAGA TCGTGTCGAT CGACGGCACC 
CGGCAGGGGG TTCAGGACAT CGTTGACGGC TGGATCTATG CCGATGACGA AACCAATCCG 
CGCTTCGGGC CGATCGCGTT TCACGAGCTG CAGAACTGGT TCGACGGTAA GCCGGTGCCG 
CGGCACATCG TGCTGACGGA TCATATCTAC ACCCCGGCGA ATGCAGCGGC GGCGCTGAAG 
AACAACGTGC CGTTCTAA

Protein sequence

MMIFRSASAL GAMAAVLSFV GVARAAPALD TAKMTQMQSK AVCVNPHPTH VNLSKLVVGF 
SQSESNANPF RAGETKSVRD AAKAFHVRRL IYTNAHSNQS RQVADVENMI NQGAQALIIA 
PLDSTGLQPA FAQAAAKHIP ILTLDRRTAG SKCSDYLSFL GSNFYFKQGE IDARELAKAT 
GGHAMVAEIQ GAYGNSVEVA RTKGFAAGLK AYPGMKIVTE QTGNWFTTDA QKVMSQILLA 
HPNVNAVYAQ ADTMAFGAIT ALRDAGKKPG QVKIVSIDGT RQGVQDIVDG WIYADDETNP 
RFGPIAFHEL QNWFDGKPVP RHIVLTDHIY TPANAAAALK NNVPF