Gene Veis_4002 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_4002
Symbol
ID	4690447
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	4393090
End bp	4394097
Gene Length	1008 bp
Protein Length	335 aa
Translation table	11
GC content	71%
IMG OID	639851750
Product	hypothetical protein
Protein accession	YP_998726
Protein GI	121610919
COG category	[S] Function unknown
COG ID	[COG3181] Uncharacterized protein conserved in bacteria
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	19
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	5
Fosmid unclonability p-value	0.0348816
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAACATCC TGGACACCGA AGCGCGCATG CCGCAGTCCA CACGCCGGCG CTGCCTCGGC 
GGCGCTGCGG CCGCAACTGC CGCGCTGGCA TGGCCCGCGC TGGCGCAGCC GGCCTATCCG 
AACCGGCCGG TCCGCCTCAT CGTGCCGTTT CCGGCCGGCG GCCCGGTCGA CACCATCGGC 
CGCGCCGTGG CGCACAAGCT CTCGCTGCTG TGGGGGCAGC AAGCCATCAT CGACAACCGG 
GCTGGCGCGG GTGGCATCGT CGGCGCGGAA GTGGCGGCGC GGGCGGTGGC CGACGGCTAC 
CACCTGCTGG TGTGCAGCAT CCACCACACG GTGCTGCCGA GCCTGCGGCC CAGGCTCTCC 
TACGACATCG AGCGCGACTT CGTGCCGCTG ACCTTCGGCG CGATGTTCCC GGTGGTGCTG 
GTGGCGCACC CTTCGCTGCC AGCGAACAAT GTGGCCGAAC TCATTGCGCT CGACAAGAAA 
TCACCGGGCC AACTGAGTTT CGGATCGTCC GGCAGCGGCG GCGGCACGCA CCTGGCGGGC 
GAGCTTTTCA ACATGCAGGC GGGCACCCGA CTGCTGCATG TGCCCTACAA GGGCAGCGCG 
CCCGCGATGA GCGGACTGCT GGGCGGGCAG GTGCAACTGA TGTTTGCCGA CGCGCCGACC 
GCGCTGCCGC AGATCAACGG CGGCAAGGTG CGCGCCCTGG CGGTGGCGAG CGCACGCCGC 
TCGGTGCTGC CGCCGGACAT CCCGACCGTG GCCGAGTCCG GCCTGCCCGG CTACGAAGCC 
TATTCATGGG CCGGTTTCAT GGCACCGGCG GGCACGCCAA AAGACATCGT GCAGCGCCTG 
GGCACCGACA TCGGCCGCGC GCTGAATGAC CCGCTGGTCA GCCAGAGGCT GCACGCGGTG 
GGCGCGGAGG CGGCGCCGGG CACGCCCGGC GCCTTTGCCC AGATGCTGCA TGCCGAGATC 
GCAAAGTGGG CCGGAGTGGT TCGCGCAGCC CGCATCCAGG TGGACTGA

Protein sequence

MNILDTEARM PQSTRRRCLG GAAAATAALA WPALAQPAYP NRPVRLIVPF PAGGPVDTIG 
RAVAHKLSLL WGQQAIIDNR AGAGGIVGAE VAARAVADGY HLLVCSIHHT VLPSLRPRLS 
YDIERDFVPL TFGAMFPVVL VAHPSLPANN VAELIALDKK SPGQLSFGSS GSGGGTHLAG 
ELFNMQAGTR LLHVPYKGSA PAMSGLLGGQ VQLMFADAPT ALPQINGGKV RALAVASARR 
SVLPPDIPTV AESGLPGYEA YSWAGFMAPA GTPKDIVQRL GTDIGRALND PLVSQRLHAV 
GAEAAPGTPG AFAQMLHAEI AKWAGVVRAA RIQVD