Gene Veis_2002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_2002
Symbol
ID	4691705
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	2272262
End bp	2273845
Gene Length	1584 bp
Protein Length	527 aa
Translation table	11
GC content	63%
IMG OID	639849768
Product	extracellular solute-binding protein
Protein accession	YP_996772
Protein GI	121608965
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.956925
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAACCCA TCTGCTTTTC CCGCACCCTG CGGACATTCG CGTTGTCGGC CGCGCTGGCG 
GCTCCGGTGC TCTGGGCGCA GGCCCAGACG CTCACTGTCG TGATGCAAGG CGGCTTGCGG 
GTGATGGATC CGATCACCAG CACCGCGTTT TTGACGCGGG ACCACGGCTA CATGATCTAC 
GACACGCTGC TCGGCACAGA CGCCCACTTC AAGATACAGC CGCAGATGGC CGACTGGAAG 
GCGTCCGCAG ATGGCCTGCG CTACCGCTTC ACCCTGCGCA GCGGACTCAA ATGGCACGAT 
GGGGCGCCCG TGACCAGCGC CGATTGCATC GCGTCGATCA AGCGCTGGGC CGAGGTCGAT 
TCGAGCGGCC AGGTGCTGCT GCCGATGATC GACAGCATCG AGGCTGTCGA CGACAAGGTA 
TTCGAGGTGG TGCTGAAAGA GCGCACCACG CTGTTGCTCG AGGGCCTGGC CAAGCTCAGT 
TCGCGCCCGG CCTTCATGAT GCCCAAACGC ATCGCCGCCA CTGCCGCCGC CACGCCGTTG 
ACCGAATACA TCGGTTCGGG CCCGTTCCGT CTGGTCCGGG CGGAATTCAA GCCCGGCCTG 
AAGGTGGTGT ACGAGAAGAA CAAGGACTAT GTGGCGCGCA GCGAGCCGGC AAGCTGGACT 
GCGGGCGCGA AGCTCGTGGG CGTCGAGCGG GTCGAATGGA TCGCCATGCC CGATGCGATG 
ACCTCGATCA ATGCGCTGAA AAATGGCGAG GTGGACTTCA TCCAGCAGGT TCCCTATGAC 
CTGGTGCCGA TGCTGGAGCA TCAGAAAAAC GTGACGGTGC AGGTGCTCGA CAAGCTCGGA 
TCGTGGACTT ACTTCCGCTT CAATCATCTT CATCCGCCGT TCGACAACAA GCTCGTGCGC 
CAGGCCGCCA TGGCTGCGGT GGGCCAGGAG GACGTGCTCA AGGCGCTCGT GGGCAACCCG 
AAGTTCTACC GGACATGCGC CGCAGTGTTT GGTTGCGGCC ATCCGAACGG CAGCAGCTAC 
GGCGCCGAAT GGGTGATCCC CTCGGACATC GACAAGGCCA AGGCCCTTTT GAAAGAGGGC 
CGCTACGACG GCATGGCGAT CGTAGTGCTG CAACCGACGG ATGTTGCCAT CGTGGCGGCC 
CAGCCGATCG TGATTGGCGC GGCCTTGCGC AAGGCGGGCT TCAAGGTCCA GATGAAGACC 
ATGGACTGGC AAACCGTGGT GACGCAGCAG GGCAATCAGA AATCGCCGCA GGAGGGCGGC 
TGGAACATCT TCGCCACCGC CGGCCTGTTG GCCACGAGCG GCGATCCAAT GACCAACACG 
ACCGTAGGAT CGAACGGCAG GAAAGCCTGG GCCGGCTGGC CCGACGTTCC GGCGATCGAG 
GTTTTGCGGC AGCGCTACGT TCGCTCCACC GACCTGGCCG AACGCCAATC CATTGCTGTG 
GAACTCCAGA AACTGGTGAT CGACAACGGC GTGGTCGCGC CACTGGGCCA GTTTCTGATT 
CCAGCGGCAT ACAGCACGGC GATCAGCGGC GTGCTGGAGT CTCCGGTGAC TGTGTTTTGG 
AACATCAAGA AATCTGCCAA ATGA

Protein sequence

MKPICFSRTL RTFALSAALA APVLWAQAQT LTVVMQGGLR VMDPITSTAF LTRDHGYMIY 
DTLLGTDAHF KIQPQMADWK ASADGLRYRF TLRSGLKWHD GAPVTSADCI ASIKRWAEVD 
SSGQVLLPMI DSIEAVDDKV FEVVLKERTT LLLEGLAKLS SRPAFMMPKR IAATAAATPL 
TEYIGSGPFR LVRAEFKPGL KVVYEKNKDY VARSEPASWT AGAKLVGVER VEWIAMPDAM 
TSINALKNGE VDFIQQVPYD LVPMLEHQKN VTVQVLDKLG SWTYFRFNHL HPPFDNKLVR 
QAAMAAVGQE DVLKALVGNP KFYRTCAAVF GCGHPNGSSY GAEWVIPSDI DKAKALLKEG 
RYDGMAIVVL QPTDVAIVAA QPIVIGAALR KAGFKVQMKT MDWQTVVTQQ GNQKSPQEGG 
WNIFATAGLL ATSGDPMTNT TVGSNGRKAW AGWPDVPAIE VLRQRYVRST DLAERQSIAV 
ELQKLVIDNG VVAPLGQFLI PAAYSTAISG VLESPVTVFW NIKKSAK