Gene Veis_3641 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_3641
Symbol
ID	4694577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	+
Start bp	4026097
End bp	4027056
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	64%
IMG OID	639851396
Product	extracellular solute-binding protein
Protein accession	YP_998375
Protein GI	121610568
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	10
Plasmid unclonability p-value	0.0351893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGCAGAT CGGTTGTGAA ATGGCTGGTG CTGGCCGCAG CATGCGTGCC GGGTCTGGCC 
GCACAGGCGC AGGCGCAAAA CACCAAACTG GTGCTGGGCA TGTCCGGCTG GACGGGCTTT 
GCGCCGCTGA CGCTGGCCGA CAAGGCGGGC CTTTTCAGCA AGCATGGCCT GGATGTGGAG 
ATCAAGATGA TTGCGCAAAA GGACCGCCAT CTGGCCCTGG CCGCCAAGTC GATTCAGTGC 
GCTGCGACCA CGGTCGAGAC CCATGTGGCC TGGAATGCCA ACGGCGTGCC CATCGTGCAG 
ATTTTTCAGA CGGACAAGTC CTACGGCGCC GACGGCCTGG CGGTGCGCGG CGATATCAAG 
GGCTTTGCCG ATCTGCGCGG CAAGACCATT GGCGTGGATG CGCCGGGCAC CGCGCCTTTC 
TTTGGCCTGG CCTGGATGCT CAGCAAGAAC GGCATGACGC TCAAGGATGT CAAGCTCACC 
ACGCTGTCGC CCCAGGCTGC GGCCCAGGCT TTCGTGACCG GGCAAGGCGA TGCGGCGATG 
ACCTACGAGC CGTATCTTTC CACCGTGCGC GACAACCCGG CTGCGGGCAA GATTTTGGCC 
ACCACGCTCG ACTATCCGAT GGTGATCGAC ACGGTCGGCT GCGACCCCGC CTGGCTCAAG 
GCCAACCCCC GGGCCGCACA GGCGCTGGCC GATTCCTATT TTGCGGCGCT GGACATGATC 
CGGGCCGATC CCGCCAAGTC CAACGACATC ATGGGCGCGG CGGTCAAGCA GACGGGCGCA 
CAGTTTGCCC GGTCGGCGTC GTTTTTGCGC TGGCAGGATC GGGCCGCGAA CCAGCGGTTT 
TTCGCCGGCG AGCTGACCGC GTTCATGAAG GACGCCACGG CCATCTTGCT GGCGACCGGC 
ATCATCCACA AAGCGCCGGA TGATCTGGCC GCGCTGTTCG ACGCACGCTT CGTGCAATGA

Protein sequence

MSRSVVKWLV LAAACVPGLA AQAQAQNTKL VLGMSGWTGF APLTLADKAG LFSKHGLDVE 
IKMIAQKDRH LALAAKSIQC AATTVETHVA WNANGVPIVQ IFQTDKSYGA DGLAVRGDIK 
GFADLRGKTI GVDAPGTAPF FGLAWMLSKN GMTLKDVKLT TLSPQAAAQA FVTGQGDAAM 
TYEPYLSTVR DNPAAGKILA TTLDYPMVID TVGCDPAWLK ANPRAAQALA DSYFAALDMI 
RADPAKSNDI MGAAVKQTGA QFARSASFLR WQDRAANQRF FAGELTAFMK DATAILLATG 
IIHKAPDDLA ALFDARFVQ