Gene Veis_4092 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_4092
Symbol
ID	4691762
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	4488376
End bp	4489935
Gene Length	1560 bp
Protein Length	519 aa
Translation table	11
GC content	69%
IMG OID	639851839
Product	protein of unknown function DUF894, DitE
Protein accession	YP_998815
Protein GI	121611008
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG2814] Arabinose efflux permease
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	11
Plasmid unclonability p-value	0.146023
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGCGC TGGCGCCGCT GACGATTCCG GTGTTCCGCA TGTTGTGGCT GACCTGGGTG 
ACGGCCAATA CCTGCATGTG GATGAACGAT GTGGCGGCGG CCTGGCTGAT GACCACGCTG 
ACCAGTTCGC CGATCCTGGT CGCGCTGGTG CAGTCGGCGT CCACGCTGCC GGTGTTTTTG 
CTCGGTCTGC CCAGCGGCGC GCTGGCCGAC ATTCTGGACC GGCGGCGCTA TTTCATCGTC 
ACCCAGTTCT GGGTTGCGGC CGTGGCGCTG GTGCTGTGCC TGGCCATCCT GGCCGGCGGC 
ATGACGGCGC CACTGCTGCT GGCGCTGACT TTTGCCAACG GCATCGGTCT GGCGATGCGC 
TGGCCGGTGT TCGCGGCCAT CGTGCCCGAA TTGGTCGCGC GCGCGCAGTT GCCTGCGGCG 
CTGGCGCTCA ACGGCGTGGC CATGAATGCC TCGCGCATCA TGGGCCCGCT GCTGGCCGGG 
GCCATCATTG CCAGCGCGGG CAGCGCCTGG GTGTTCGTGC TCAATGCCGT GCTGTCGGTG 
CTGTCCGGCC TGGTCATCAT GCGCTGGAAG CGCGTCCATG TGCCCAACCC GCTGGGGCGC 
GAGCGCCTGC CCAGCGCGAT GCGCGTGGGC CTGCAATTCG TGGGCCAGTC GCCGCGCATG 
AGGGCGGTGA TGTGGCGCAT CTCGATCTTC TTTTTGCACG CCACCGCGCT GCTGGCGCTG 
TTGCCGCTGC TGGCCCGGGG GCTGGAGGGC GGCGGCGCCG GCACCTTTAC GCTGCTGCTG 
GCGTCAATGG GCGCGGGGGC GATCTCGGCG GCGCTGTTTT TGCCGCGCCT GCGCCAGGCC 
ATGGCGGGCG ACACGCTGGT GATCCGCGGC ACCCTGCTGC AGGCGGCGGC CACCGGGGTG 
ATGGCCATCG CGCCGAATGT CCAGGTGGCC GTGCCGGCGA TGTTCATCGG CGGCATGGCC 
TGGATCACCA CGGCCAACTC GCTGAGCGTG TCGGCCCAAC TGGCGCTGCC CAACTGGGTG 
CGCGCCCGGG GCATGTCGAT CTACCAGATG GCCATCATGG GCTCGACCGC GCTGGGCGCC 
GCGCTGTGGG GCCAGGTGGC CACGCTCGGC AATGTGCACC TGAGCCTGGG GCTGTCGGCG 
CTCTCCGGGG TGTTGGCGAT GCTGCTGGTG CAGCGCCTGG TGGCCGACCG CAGCATCGAA 
GAAGACCTGA GCCCCTCGCG CGCCTTCAAG GCGCCGGTGC TCGACATCCC GCCGGAATCG 
GGCCATGTGG TGGTGACCAT CGAATACTTC ATCGACCCGG CGCGCGCGGC GGAATTTCGC 
GCGCTGATGC AAGACAGCCG GCGCAGCCGC CTGCGCCAGG GCGCATTGGC CTGGCAGCTA 
CAGCACGATA TCACCGACCC CGCGCGCTAT GTCGAGCAGA TCGAGGATGA ATCCTGGACC 
GAGCACCTGC GCCGCTTCGA CCGCGTCACC GCCCACGACG TGGCGCTGCG CGAGCGCAAA 
CTGGCGTTCC ACACCCGGGA CACACCGCCC GTGGTCTCGC GCCTGCTGGT GCAGCGCTGA

Protein sequence

MTALAPLTIP VFRMLWLTWV TANTCMWMND VAAAWLMTTL TSSPILVALV QSASTLPVFL 
LGLPSGALAD ILDRRRYFIV TQFWVAAVAL VLCLAILAGG MTAPLLLALT FANGIGLAMR 
WPVFAAIVPE LVARAQLPAA LALNGVAMNA SRIMGPLLAG AIIASAGSAW VFVLNAVLSV 
LSGLVIMRWK RVHVPNPLGR ERLPSAMRVG LQFVGQSPRM RAVMWRISIF FLHATALLAL 
LPLLARGLEG GGAGTFTLLL ASMGAGAISA ALFLPRLRQA MAGDTLVIRG TLLQAAATGV 
MAIAPNVQVA VPAMFIGGMA WITTANSLSV SAQLALPNWV RARGMSIYQM AIMGSTALGA 
ALWGQVATLG NVHLSLGLSA LSGVLAMLLV QRLVADRSIE EDLSPSRAFK APVLDIPPES 
GHVVVTIEYF IDPARAAEFR ALMQDSRRSR LRQGALAWQL QHDITDPARY VEQIEDESWT 
EHLRRFDRVT AHDVALRERK LAFHTRDTPP VVSRLLVQR