Gene Veis_0944 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_0944
Symbol
ID	4693580
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	1057692
End bp	1058960
Gene Length	1269 bp
Protein Length	422 aa
Translation table	11
GC content	63%
IMG OID	639848722
Product	extracellular solute-binding protein
Protein accession	YP_995740
Protein GI	121607933
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1653] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.544942
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATCCCG CACCACTTTG CAGCGCAGCG CTGGCCTTCG GGCTGGCGAC GGCAGCGCTC 
GCCCAAGAGC CCAAGGTGAT TACCGAATGG GACATTCAGA CCCAGCCCGG GGGCTCCAAG 
CTGATACAGG AGGCGCAGGC GCGCTTCGAG AAGGCCAACC CCGGCTTCAA GGTGCAGCGC 
ACGCAAATCC CCAACGACGC CTACAAGACC AAGCTGAAGA TCGCGATGGG GGCCAATGAG 
CCGCCATGCG TGTTCACGAG TTGGGGCGGC GGGGTGCTGC GCGAGTACAT CAAGGCCGGT 
CAAGTCGTCG ACCTCGGTCC TTACCTGGCC AAAGATCCCG CGTTTCGTGA GCGCTTCCTG 
CCCAGCGCCT TCGACGCCAT CACCTGGCAG GGCAAAACCT ACGGCCTGCC GGGGGAGAAC 
ACCACCGCAG CCGTGATTTA CTACAACACC GAGATCTTCG CCAAGTTCGG GCTCGCGCCG 
CCCAAGACCT GGCCCGAACT GATGAAGCTC GTCGAGACGC TCAAGGCCAA CGACGTGGCC 
CCGTTTGCCC TGGCCAACAA GGCCAAGTGG CCCGGTTCGA TGTACTACAT GTACCTCGTC 
GACCGCATTG GCGGACCGGA GGTGTTCCGC AAAGCCATTG CCCGCGCGCC GGGTGGCAGC 
TTTGCCGACC CGGCCTTCGT CGAGGCCGGC AAATATCTGC AAGAACTGGT CAAGGCCGGC 
GCCTTCGCGC AGGGCTTCAA CGGCCTGGAC TACGACATTG GCGCAGCGCG CAGATTGCTG 
TACTCGGGCA AGGCCGCCAT GGAACTGATG GGAACCTGGG AATCATCGAA CATCAAGAAC 
GAAAACCCGG AATTCGCCAA AAAGGTGGAC TTCTTCCCGT TCCCCGGCGT GCCGGGCGGC 
AAGGGGCAGG CGGGCAATGT CGTCGGCTCC GTGGGGCAAA ACTTCTACAG CATATCGACG 
GCCTGCAAGA CGCCCGAGGC GGCCTACCAG TTGATCACGA CGATGCTCGA CGAGGCCTCG 
GTCAAGGCGC GCCTGGCAGA CAAGCGCCTG GTGCCGGTCA AGGAACTGAC GATCGCCGAT 
GCCCCGATGC AGCGGGTGAT GCAACTGGTG GCCGACGCGC CGGCCGTGCA ACTGTGGTAC 
GACCAGGAAC TGCCGCCGCA GTTGGCCGAA CTGCACAAGG ACACGGTGCA GGCCCTGTTC 
GGGCTGTCGA TCACGCCCGA AGAAGCAGCG CAAAAGATGC AAGCGCTGGC CGCGCAAATC 
CTCAAGTAG

Protein sequence

MNPAPLCSAA LAFGLATAAL AQEPKVITEW DIQTQPGGSK LIQEAQARFE KANPGFKVQR 
TQIPNDAYKT KLKIAMGANE PPCVFTSWGG GVLREYIKAG QVVDLGPYLA KDPAFRERFL 
PSAFDAITWQ GKTYGLPGEN TTAAVIYYNT EIFAKFGLAP PKTWPELMKL VETLKANDVA 
PFALANKAKW PGSMYYMYLV DRIGGPEVFR KAIARAPGGS FADPAFVEAG KYLQELVKAG 
AFAQGFNGLD YDIGAARRLL YSGKAAMELM GTWESSNIKN ENPEFAKKVD FFPFPGVPGG 
KGQAGNVVGS VGQNFYSIST ACKTPEAAYQ LITTMLDEAS VKARLADKRL VPVKELTIAD 
APMQRVMQLV ADAPAVQLWY DQELPPQLAE LHKDTVQALF GLSITPEEAA QKMQALAAQI 
LK