Gene Acid345_4006 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Acid345_4006
Symbol
ID	4071142
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Candidatus Koribacter versatilis Ellin345
Kingdom	Bacteria
Replicon accession	NC_008009
Strand	-
Start bp	4732716
End bp	4733699
Gene Length	984 bp
Protein Length	327 aa
Translation table	11
GC content	56%
IMG OID	637986033
Product	ABC sugar transporter, periplasmic ligand binding protein
Protein accession	YP_593080
Protein GI	94971032
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.82922
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGTCCGCAC CCAAGAAAAT CGCTCTGACA CTTATTGCCG CAGCCTCCTG TCTCCTTGCC 
GGCTGTGCCA AGCATGACAA CGACGAGAAG TACATCCTGG TAACGGTCAA TTCGAAGGTT 
GAGTATTGGA AGACCGCGCA GGCGGGCCTG ACCAAAGCCG CTGCGCAATA CGGCGTGAAA 
TGGGACGTCC GCGGTCCTGA AAACTATGAT CCCCAAGCGG AGGTGCAGGA GTTCCGCAAT 
GCTGCGGCAC AGAAACCTTC CGGCATCCTG GTGTCCGTCG CCGATGCTTC GCTGATGCAA 
CCGGCAATTG ACGAGGCTAT TAACGCAGGC ATTCCCGTCC TCACCATCGA TTCCGATGCC 
CCGAAGAGCA AGCGCCTTTA CTTCATCGGT ACCAACAACC GCCAAGCCGG TACGCTCGGC 
GCAAAACGCC TGGTCGAGAA GCTTCACGGG AAGGGCAATG TCGTCTTCTT CACCATGCCC 
CAACCGAACC TCGACGAACG GTTAGCGGGC TATAAAGACG TTCTCTCTGA CAATCCCGGT 
ATCAAGATCG TGGAGGTCGT GAACATCAAA GGTGATTCCG GCAATGCCTT TGACCGCACC 
GCGCATTATG CTGGCGCCAA AGATGCTCAG AAAATCGACG CCTTCGTCTG CCTGGAGGCG 
ACGTCGGCGA AGGATGTCGC GCTTGCGCTG AAACGCGAAA ACGTAACCGA CCGGCTGGTA 
ATTGCAATGG ACGTTGATCC CGCTACACTC GACCTCATTA AGTCAGGCGT GGTGGATGCG 
ACCATTGCGC AGAAGCCCTA CACCATGGCG TTTTATGGAC TGAAGGCCCT CGATGAGATA 
CATCACGGAA AGCCAGATCT CACCAAGGAC TACTCGTTCG ACTCGTTCTC GCCATTCCCA 
GCGTTTGTCG ATACCGGCAC CTCAGTTGTT GACAAGACAA ACGTGGATCT CTATCTGCAA 
GCGCGAGCTG CGAACGCAAA ATAA

Protein sequence

MSAPKKIALT LIAAASCLLA GCAKHDNDEK YILVTVNSKV EYWKTAQAGL TKAAAQYGVK 
WDVRGPENYD PQAEVQEFRN AAAQKPSGIL VSVADASLMQ PAIDEAINAG IPVLTIDSDA 
PKSKRLYFIG TNNRQAGTLG AKRLVEKLHG KGNVVFFTMP QPNLDERLAG YKDVLSDNPG 
IKIVEVVNIK GDSGNAFDRT AHYAGAKDAQ KIDAFVCLEA TSAKDVALAL KRENVTDRLV 
IAMDVDPATL DLIKSGVVDA TIAQKPYTMA FYGLKALDEI HHGKPDLTKD YSFDSFSPFP 
AFVDTGTSVV DKTNVDLYLQ ARAANAK