Gene Veis_0934 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_0934
Symbol
ID	4693530
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	1043888
End bp	1045444
Gene Length	1557 bp
Protein Length	518 aa
Translation table	11
GC content	69%
IMG OID	639848712
Product	sulfatase
Protein accession	YP_995730
Protein GI	121607923
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG3119] Arylsulfatase A and related enzymes
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACCAGC ACCCGGCTGC ATCGCTGACC CGGCCGCGCA ACGCCGTGGT CATTTTGCTC 
GACAGCCTGA ACCGCCACCT GCTGGGCGCC TATGGCGCCA CCGAGTTCGA GACCCCGCAG 
ATCGACCGCT TTTGCGCCAG CGCCCTGCGC TTTGACCGGC ACTATGCCGG CTCGCTGCCG 
TGCATGCCGG CGCGCCACGA TATCTTGTGC GGTGCGCTGG ACTTTCTCTG GCGTCCCTGG 
GGATCGATCG AAGTCTGGGA GGACGCGATC ACCTACTGGC TGCGCAACGC CGGCGTCGTC 
ACCCAACTGA TCTCGGACCA CCCGCACCTG TTCGAGAGCG GCGGCGAAAA CTACCACGCC 
GACTTTCAGG GCTGGGACTA TCTGCGCGGC CACGAAAGCG ACCCGTGGAA AACGGCGCAA 
AGCGAGTGCG CCATCGGCGC CCCGCTGCAC CAGGTGCTGC CCGGCCCCTT CCCGCACGAG 
TACGACACCA ATCGCACCTG GTTCAAGCGC GAAGAAGACT TTCCCGGCCC GCAGACCATG 
GCCAGCGCCG CGCGCTGGAT CGACGAGAAC GCCGGACGGC ATCAGCGTTT CTTCCTGATG 
ATCGACGAGT TCGATCCGCA CGAACCCTTC GACACGCCAC AGCCCTGGGC CTGCCGGTAC 
CGGCAGGCCC AGGGGGCCGA TGAGCACCAG CCGCTGCTGG TATGGCCGCC CTACGCGGTG 
GATGCGATCG AGCGCGGCGT GCTCACGGCC GCCCAGGCGC AGGAACTGCG CAACAACTAC 
GGCGCCAAGC TGTCGATGAT CGACCATTGG CTGGGCCGGG TGCTCGACGC GATCGAGCGC 
AATCGGCTGG CCGCCGACAC CGCCGTGATC CTGTGCACCG ACCACGGCCA CTACCTCGGC 
GAGCGCGACA TCTTCGGCAA ACCGGGCGTG CCGCTGTACC AGCCGATGGC CCATATCCCG 
CTGATGATCC GCTGGCCCGG CATGGCGCCG GGCCGCCGCG ACATGCTGAC AACGAGCGTG 
GACATCCACG CCACCATTGC CGACATCTTC GGCGTGTCGG CCGCGCACCG CACGCATGGG 
CGCTCGCTGC TGCCCGCCAT CGCCGACCCG GGCCAGCAGG TGCGCGAGCA TTTGCTGGCC 
GGCGTCTGGG GCCGCGAGGT GCATTACATC GACCGCAGCC ACAAATACGT TCGCGCCCCG 
GCGCAGGCCA ACGCGCCGCT ATCGATGTGG TCCAACCGCT GGTCGACGAT GCCGCAGCAC 
CATGTGCCGG GCCGGCGTCT GCTGCCGCCC GACCGCCGCG CGCGCATCGA CTTCATGCCC 
GGCAGCCAGG TGCCGGTGCT GCGCCAGCCC TTCGTCGAGG GCGACCTGCT GCCGCTATGG 
GCGCGGAACC TGCGGTTCAG CGGCAACCAC CTGTGGAACC TCGACGCCGA CCCCCGCGAG 
CAGACCGATC TGGCCGGCAG CGCGCTGGAG GCCGAGTACG CGCACAAATT GCACGCCGCG 
CTGCGGGCCA TCGAGGCGCC GGATGACCAG GCCATCCGGC TCGGGCTTGG GGTTTGA

Protein sequence

MNQHPAASLT RPRNAVVILL DSLNRHLLGA YGATEFETPQ IDRFCASALR FDRHYAGSLP 
CMPARHDILC GALDFLWRPW GSIEVWEDAI TYWLRNAGVV TQLISDHPHL FESGGENYHA 
DFQGWDYLRG HESDPWKTAQ SECAIGAPLH QVLPGPFPHE YDTNRTWFKR EEDFPGPQTM 
ASAARWIDEN AGRHQRFFLM IDEFDPHEPF DTPQPWACRY RQAQGADEHQ PLLVWPPYAV 
DAIERGVLTA AQAQELRNNY GAKLSMIDHW LGRVLDAIER NRLAADTAVI LCTDHGHYLG 
ERDIFGKPGV PLYQPMAHIP LMIRWPGMAP GRRDMLTTSV DIHATIADIF GVSAAHRTHG 
RSLLPAIADP GQQVREHLLA GVWGREVHYI DRSHKYVRAP AQANAPLSMW SNRWSTMPQH 
HVPGRRLLPP DRRARIDFMP GSQVPVLRQP FVEGDLLPLW ARNLRFSGNH LWNLDADPRE 
QTDLAGSALE AEYAHKLHAA LRAIEAPDDQ AIRLGLGV