Gene Veis_3171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_3171
Symbol
ID	4691645
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	3533485
End bp	3534816
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	63%
IMG OID	639850933
Product	extracellular solute-binding protein
Protein accession	YP_997919
Protein GI	121610112
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0465993
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	14
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCTATC CCTTCCGTGC TGTCGCAGTT TGCCGACGGG CTTGGGTCAC CGCCCTGGGC 
TTGTCGCTGT GCGCTGGCGC CAGCGCGCAG ACCGAGTTGG TCATTGCCAC CGTGAACAAC 
GGCCACATGA TCGAGATGCA AAAGCTCGGC AAGCACTTCG AGCAGGCCCA CCCTGACATC 
CGGCTCAAGT GGGTCACGCT GGAGGAGGGT GTGCTGCGCC AGCGCGTGAC GACCGATATC 
GCCACCAAGG GCGGCCAGTT CGATGTGATG ACCATTGGCA TGTATGAGAC GCCGATCTGG 
GGCAAGAAGG GCTGGCTGCA GGCGTTGAAG ACCGACGCCG CCTACGATGC CGACGATCTG 
TTGCCCGCGA TACGCCAGGG CCTGTCGGTC GACGGCAAGC TGTTCGCGGC CCCGTTCTAC 
GGCGAAAGCT CGATGCTGAT GTACCGCAAG GACTTGGCCG ACAAGGTGGG GGTGCAGGTG 
CCCGAGCGTC CGACCTGGCC GCAGATCAAG GATTTGGCGG CCAAGATCCA CGACCCCAAA 
AACGGCGTGT ACGGCATCTG CCTGCGCGGC AAGCCGGGCT GGGGCGACAA CATGGCTTTT 
CTGAGCACGC TGGTGAACAC CTTCGGCGGC CAATGGTTCG ACATGCAGTG GAAGCCGCAG 
CTTCAGTCCA AGCCCTGGCA GGAGGCCATC CACTTTTATG TCGATCTGCT CAAGCACCAT 
GGCCCGCCCG GCTCGTCGGC GAACAGTTTC AACGAGCTCC TGGCGCTGAC CAATTCCGGT 
AAATGCGGCA TTTGGATCGA CGCCACCATT GCCGCCTCGT TCGTCAGCGA TGCCAGGCAG 
TCGAAGGTGG CCGGGCAAAT GGCTTTTGCC CAGGCGCCGA CGATGCACAC GCCCAAGGGC 
GCGAACTGGC TGTGGTCGTG GAATCTGGCG ATTCCGGCAG GTTCCCGGAA GGTGGACGCG 
GCGCAGAAGT TCATCACCTG GTCGACCAGC AAGGACTATG TGCAACTGGT GGCCAAAACC 
AATGGCTGGG CCAATGTGCC CACCGGCACG CGCCGGAGCA CCTATGCCAA TGCCGAGTTC 
CAGAAGGCGG CCCGTTTTGC GGCCGCAGAA AAGATGGCCA TCGATTCGGC CAACCCCACG 
GACGCGACGC TGCCCCAAAG TCCCTATATC GGCGTGCAGT TTGCCGCCAT TCCTGAATTC 
CAGGCCATCG GCATCGCTGT GGGCCAGCAG ATGAGCGCGG CGCTGGCTGG CAAGAGCACG 
GTCGAGGCGG CCCTGAAGGC CAGCCAGACC CTGGCCGAGC GTGAGATGAA GAAGGCGGGC 
TACTACCGGT GA

Protein sequence

MPYPFRAVAV CRRAWVTALG LSLCAGASAQ TELVIATVNN GHMIEMQKLG KHFEQAHPDI 
RLKWVTLEEG VLRQRVTTDI ATKGGQFDVM TIGMYETPIW GKKGWLQALK TDAAYDADDL 
LPAIRQGLSV DGKLFAAPFY GESSMLMYRK DLADKVGVQV PERPTWPQIK DLAAKIHDPK 
NGVYGICLRG KPGWGDNMAF LSTLVNTFGG QWFDMQWKPQ LQSKPWQEAI HFYVDLLKHH 
GPPGSSANSF NELLALTNSG KCGIWIDATI AASFVSDARQ SKVAGQMAFA QAPTMHTPKG 
ANWLWSWNLA IPAGSRKVDA AQKFITWSTS KDYVQLVAKT NGWANVPTGT RRSTYANAEF 
QKAARFAAAE KMAIDSANPT DATLPQSPYI GVQFAAIPEF QAIGIAVGQQ MSAALAGKST 
VEAALKASQT LAEREMKKAG YYR