Gene Veis_4349 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_4349
Symbol
ID	4691514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	4790901
End bp	4792640
Gene Length	1740 bp
Protein Length	579 aa
Translation table	11
GC content	70%
IMG OID	639852094
Product	sulfatase
Protein accession	YP_999070
Protein GI	121611263
COG category	[R] General function prediction only
COG ID	[COG2194] Predicted membrane-associated, metal-dependent hydrolase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.398112
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.728931
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGCCATGC TGTCGACCCT GCGGCGCCTG CTGCCGATGG CCCTGCGCAG CGCGTTTGCA 
CGCCGCCCCG GCGACCCCGC CAGCCCCTCT GGCCGCCGTC CGATCCACCC GGCCCAGGTG 
GTGCTGCTGA CCAGCGCCTG GCTGGCCAGC GCCTGCAATC TGCCGCTGTG GCAGGCCGTG 
GCCCGGCTGC CCGGGCAGGG CAGCCTGCGC GGCTGGGGCT TTGCGCTGGC CTTCTGGCTC 
ATCGTGATGG CCGGCAACAC CGCCCTGCTG AGCCTGCTGG CCTGGCGCTG GACGCTCAAG 
CCCGCCGTCG TGCTGCTGCT GCTGATGGCG GCGTTTGGCG CGTATTTCAT GCTCGCCTAT 
GGCATCGTGA TCGACGCCGG CATGCTGGTC AATGTGCAGC AGACCGACCC GCGCGAAGCC 
CGCGACCTGC TCAGCGGGCG CATGGCGGTG ACCGTCTCGG CGCTGGCCCT GCCCCCGCTG 
CTGTGGCTGC GCCGCCGCCC GTTGCAGCGC CTGGGCGCGC TGCGCCAACT GCGCAGCAAC 
AGCCTGCTGC TCGGCGGCTC GATCACGGTC GGCCTGCTCA GCCTGCTGCT GGTCTTTCAG 
GACTTCGCCT CCGCGATGCG CAACCACAGC CAGATGCGCT ACCTGATCAA CCCGCTCAAC 
AGCGTGTACG CGCTGGGCCA TCTGGCCGCC CAACCGCTGC GCATGGACAC CAGCGTGCTG 
CTGCCCCTCG GGCGCGACGC CCGGCTCGGC GCCAGCTATG CCGGCCAGAC CCAGGCGCCG 
CTGCTGATCC TGGTGCTCGG CGAAACCGGC CGCAGCCAGA ACTTCGGCAT CAACGGCTAC 
GAGCGCGACA CCACTGCGCT GCTCGCGGCG CGCAAAGACC TGATCAGCGC GCGCAACGCC 
TGGTCTTGCG GCACCAGCAC CGCCGCATCG CTGCCGTGCA TGTTCTCGCA CCTGGGGCGC 
GCAGGCTATG CCGGGCGCTC GGCCAACCAT GAGAACCTGC TCGACGTGCT GCAACACGCG 
GGCCTGGCCC TGCTGTGGGT GGACAACCAG GCCGGCTGCA AAGGCGTGTG CGCGCGCATC 
GCGCAAACCC GCCCGGCCAC CGATCCGGCG CTCTGCCCCG ACGGCGAATG CCTGGACCGC 
GCGATGCTCG ACGGCCTGTC CGCCCAAATC GCCGCGCTGC CCGCCGCGCG GCGCCAGCGC 
GGCACCGTGG TCGTGCTGCA CCAGATCGGC AGCCACGGCC CGGCCTACTA CAAGCGCTCG 
GCGCCACAGA ACAAGAAGTT CATGCCCGAA TGCCACTCGG CCGCGCTGCA AGAATGCGCG 
CGCCAGCAGG TGGTCAACGC CTACGACAAC AGCATCGTCG AGACCGACCA GTTTCTCGCT 
GCGCTGCTGC AATGGCTGGC AGCACCGGGC CACGCGCAGG ACCATGCCCA GGCCGCGATG 
ATCTATGTCT CCGACCATGG CGAATCGCTC GGCGAAAACA ACCTGTACCT GCACGGCCTG 
CCCTACGCCA TCGCCCCCGA CGTGCAAAAG CATGTGCCCT GGATCACCTG GCTATCCCCC 
GCGATGCAGG CGCGCACCGG CCTTGCCACC GGCTGCCTGC AGCGCGACCT GGGCCAGCGG 
CAGATCAGCC ACGACAACTA CTTCCACTCG GTGCTCGGCC TGATGGATGT GCAAACCAGC 
GCCTACGACC CGGCGCTGGA CATGTTTGCG CGCTGCAAGG CCAGGGGCGA AAAGGAATAG

Protein sequence

MAMLSTLRRL LPMALRSAFA RRPGDPASPS GRRPIHPAQV VLLTSAWLAS ACNLPLWQAV 
ARLPGQGSLR GWGFALAFWL IVMAGNTALL SLLAWRWTLK PAVVLLLLMA AFGAYFMLAY 
GIVIDAGMLV NVQQTDPREA RDLLSGRMAV TVSALALPPL LWLRRRPLQR LGALRQLRSN 
SLLLGGSITV GLLSLLLVFQ DFASAMRNHS QMRYLINPLN SVYALGHLAA QPLRMDTSVL 
LPLGRDARLG ASYAGQTQAP LLILVLGETG RSQNFGINGY ERDTTALLAA RKDLISARNA 
WSCGTSTAAS LPCMFSHLGR AGYAGRSANH ENLLDVLQHA GLALLWVDNQ AGCKGVCARI 
AQTRPATDPA LCPDGECLDR AMLDGLSAQI AALPAARRQR GTVVVLHQIG SHGPAYYKRS 
APQNKKFMPE CHSAALQECA RQQVVNAYDN SIVETDQFLA ALLQWLAAPG HAQDHAQAAM 
IYVSDHGESL GENNLYLHGL PYAIAPDVQK HVPWITWLSP AMQARTGLAT GCLQRDLGQR 
QISHDNYFHS VLGLMDVQTS AYDPALDMFA RCKARGEKE