Gene Veis_0804 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_0804
Symbol
ID	4690961
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	889220
End bp	890524
Gene Length	1305 bp
Protein Length	434 aa
Translation table	11
GC content	66%
IMG OID	639848579
Product	extracellular solute-binding protein
Protein accession	YP_995602
Protein GI	121607795
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.793174
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	15
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCCAAG CCTTGCGCTG CCCGAGCCTG CACGCCCTCG CCGCTGTGGT TGCAATCTTG 
TGCGCCGGCG CCACCGGCGC CCAGGATTTC AACTGGAAAA AGCACCAGGG CAAGACATTG 
ACCTTTCTGG CCAACAACAA CCCCGTGGCC AACGCGCTGC TCAAGTACCA GGGCGAGTTC 
GAGCAGCAAA CGGGCATGAC GCTCAAGGTC GACGCCTATC AGGAGCAGCA GATGCGCCAG 
CGCCTGGTCA CGGTGATGAA TGCGCGCAGC GACGAGGTGG ATGTGTTCAT GTCGCTGCCC 
TCGCGCGAGG GCTTGCAGTT CGCCAAGGCC GGCTGGTACG CCGACCTCGC GGAACTGCTC 
AAGAGCGCGA GCGCCAGGGA CTACGACGCC ACCGGCTTGA GCGCCGGCAT GATCCGGGAC 
GCCACCTACG GCAAGCAACT CACCGGCATT CCGATGAATG TCGAAGGCCC GGTGCTCTAC 
TACCGCAAGG ACTTGTTGCG CAAATGCGGC CTGGCATTGC CCGAGAGCCT GACCGGGTTG 
GAGGCCGTGG CGGCCAAGCT CAAGCGTTGC GAGCCTGGCA TCGCGCCCTT CGTCTCGCGC 
GGCTTGAAGC CTGCCCTGCC ATTTACCCAC AGCGTGTTCC TGCGCAACAT GGGCGGCCAG 
TACATGAAGG ACGGCCGATC GCAACTGTGC AGCCAGGCCG GCCAAGCCTC GCTGGCGCTG 
TACGCCAGAC TGCTCAAGGA CTACGGCCCG CCGGGTGTCG TGAACTACAA CTTCTATCAG 
ATCTCCTCGC TCTACAAGGA GGGCAAGGCG GCGATGGCCT TCGAGTCCTC GAACGAGTTG 
CGCAACATGA TGGACGGCGG CGCCCGCCTG AAGGACACGG CGGTCGCCGT GCTGCCGGCG 
GGCCCTGGCG GCTCGCGCCC GACCGTGATC GGCTGGATCA TGTCGGTGTC GGCGCACAGC 
AAGCACAAGG AGGCCGCCTG GTACTTCGTG CAATGGGCCA CCAGCCCCGC GATCCAGGCC 
AGGCTGGCGC TCGACGGGAT AGCGCCGCCG CGCGCGGCCG TGGCCCAGGC GCCCGGCTAT 
AAAGCCTGGA TGGACGAGCA GCCGGTGCGC TCCGAATGGG TCGCGGCCGT CAACGAACTG 
GCGCGCACCG GCACTTCCGA AGTGGGCTAC CCGATCGCCG CCAATCCGGC CTCGCGCGAG 
CTCATCGGCC AGGCGGTCAC CGAATTGCTG CTCGGCCAGA AACTGCCGGC ACAGGCCTGC 
GCCGATGCGG ACAGGCAGCT CGATGCGTTG ATCGCCAAAG AGTGA

Protein sequence

MSQALRCPSL HALAAVVAIL CAGATGAQDF NWKKHQGKTL TFLANNNPVA NALLKYQGEF 
EQQTGMTLKV DAYQEQQMRQ RLVTVMNARS DEVDVFMSLP SREGLQFAKA GWYADLAELL 
KSASARDYDA TGLSAGMIRD ATYGKQLTGI PMNVEGPVLY YRKDLLRKCG LALPESLTGL 
EAVAAKLKRC EPGIAPFVSR GLKPALPFTH SVFLRNMGGQ YMKDGRSQLC SQAGQASLAL 
YARLLKDYGP PGVVNYNFYQ ISSLYKEGKA AMAFESSNEL RNMMDGGARL KDTAVAVLPA 
GPGGSRPTVI GWIMSVSAHS KHKEAAWYFV QWATSPAIQA RLALDGIAPP RAAVAQAPGY 
KAWMDEQPVR SEWVAAVNEL ARTGTSEVGY PIAANPASRE LIGQAVTELL LGQKLPAQAC 
ADADRQLDAL IAKE