Gene Veis_2065 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_2065
Symbol
ID	4692648
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	2345794
End bp	2347611
Gene Length	1818 bp
Protein Length	605 aa
Translation table	11
GC content	67%
IMG OID	639849829
Product	extracellular solute-binding protein
Protein accession	YP_996833
Protein GI	121609026
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	0.414534
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	3
Fosmid unclonability p-value	0.00479598
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCAGCCC GGCGGGCCGA GGGCCATTCT CTATGGCTGG CACATATCAT GCTCGGAGCC 
GTTTGTCCCG TCGTCCCCCG TTCGCCTGCG TCGCGCATCC CGTTCCTGTC CCGTTTTTCG 
TCATCCCACA CCCCGGAGTT CCATGTGCAG CATGCCGCCC CCGCCTCGTC CCTGAAACAA 
CCCCTGGCCG CCTGCGCCGC GCTGGCCGCG CTGGCCGCCC TGGCACTGGC CGCGCCGGCC 
GCGCTGGCGC AGGAAAAGAC GCTGCGCATC GCGATGACCG CAGCCGACAT TCCGCGCACC 
CTCGGCCAGC CCGACCAAGG CTTCGAGGGC AACCGCTTCA CCGGCATCCC GATCTACGAC 
TCGCTCACGC AGTGGGATTT GTCGCAAGCC GATGCCCCCA GCGTGCTGAT TCCCGGCCTG 
GCCACCTCGT GGGCCGTCGA CGCGAAAGAC AAGACCCGGT GGGTCTTCAC ACTGCGCCCC 
GGCGTCAAGT TCCACGACGG CTCGGCCTTC GACGCCGACG CAGTGGTGTG GAACGTGCAA 
AAGGTGCTCG ACAAGAACGC GCCGCAGTTC GACGCCAGCC AGGTCGGCGT GACCACATCG 
CGCATCCCCA CGCTGCGCAG CGCGCGCAAA ATCGACGACC TCACGGTCGA ACTCGGCACC 
AGCGAGCCTG ACGCCTTCCT GCCGATCAAC CTGACGAACC TGTTCATGGC CTCGCCCGCG 
CAGTGGCGCA AGAAGTTCGA CGCCGCAGCC GGTGCAACGC CGGCCGACAA GGCCAAAGCC 
GCCTGGACCG CCTTTGCCGC CGACCCTGCC GGCACGGGTC CGTTCAAGGT CACGCGCTTC 
GTGGCGCGCG AGCGGCTGGA GTTGGCCGCC AGCAAAACCT ATTGGGATGC CAGGCGCGTG 
CCGAAGATCG GCAAGGTGGT GCTGCTGCCG ATGCCCGAAG CCAACGCGCG CACCGCTGCG 
CTGCTGGGCG GGCAGGTCGA CTGGATCGAG GCGCCGGCGC CCGACGCCAG CGCGCAAATC 
ACGCAGCGCG GCTTCAAGAT CTACGCGAAC GCGCAGCCGC ATGTCTGGCC GTGGCAGTTG 
TCGTTCATCG CAGGCTCGCC CTGGCTCGAC AAGCGTGTGC GCCAGGCTGC CAACCTGTGC 
ATCGACCGCA GCGGCATGAA GCAGTTGCTC GGCGGCATGA TGGCCGAGCC CAAGGGCACG 
GTGTCGCCGG GCCATCCGTG GTTCGGCAAG CCCGGCTTCG ACATCCGGTA CGACCCGAAG 
GCCGGGCAGG CGCTGATGGA GCAGGCCGGC CATTCGGCCG CCAAGCCGCT CAAGGTGAAG 
GTGCAGATAT CGGCCTCGGG ATCGGGCCAG ATGCAGCCGC TGCCGATGAA CGAGTTCGCG 
CAGCAGTCGC TCAAGCAGTG CTTTTTCGAC GTGCAGTTCG ACGTCATCGA ATGGAACACG 
CTCTCGACCA ACTGGCGCAA GGGCGCCAAG GATGCGTCAG CCAACGGCGC CAGCGCGGTC 
AACGTCAGTT TCTCGGCGAT GGACCCGTTC TTTGCGATGG CACGCTTCGT CAGCACCAAG 
GCTTTCCCGC CGCTGTCGAA CAACTGGGGC TATTACGGCA ACGCCGAGGT CGACCAGTTG 
GTGGCCGATG CGCGCACCAG TTTCGACGAC AAGGCGCGCG ATGCCGCGCT GGCCAGGCTG 
CACACACATA TCGTGGACGA CGCGCCCTTC GTCTGGATCG CGCACGATGT GGGTCCGCGC 
GCGCTATCGC CCAAGATCAA GAACGTGGTG CAGCCCAGGA GTTGGTTCAT CGACATCGCA 
ACGATGACCA TGGACTGA

Protein sequence

MAARRAEGHS LWLAHIMLGA VCPVVPRSPA SRIPFLSRFS SSHTPEFHVQ HAAPASSLKQ 
PLAACAALAA LAALALAAPA ALAQEKTLRI AMTAADIPRT LGQPDQGFEG NRFTGIPIYD 
SLTQWDLSQA DAPSVLIPGL ATSWAVDAKD KTRWVFTLRP GVKFHDGSAF DADAVVWNVQ 
KVLDKNAPQF DASQVGVTTS RIPTLRSARK IDDLTVELGT SEPDAFLPIN LTNLFMASPA 
QWRKKFDAAA GATPADKAKA AWTAFAADPA GTGPFKVTRF VARERLELAA SKTYWDARRV 
PKIGKVVLLP MPEANARTAA LLGGQVDWIE APAPDASAQI TQRGFKIYAN AQPHVWPWQL 
SFIAGSPWLD KRVRQAANLC IDRSGMKQLL GGMMAEPKGT VSPGHPWFGK PGFDIRYDPK 
AGQALMEQAG HSAAKPLKVK VQISASGSGQ MQPLPMNEFA QQSLKQCFFD VQFDVIEWNT 
LSTNWRKGAK DASANGASAV NVSFSAMDPF FAMARFVSTK AFPPLSNNWG YYGNAEVDQL 
VADARTSFDD KARDAALARL HTHIVDDAPF VWIAHDVGPR ALSPKIKNVV QPRSWFIDIA 
TMTMD