Gene Veis_1109 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Veis_1109
Symbol
ID	4693263
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Verminephrobacter eiseniae EF01-2
Kingdom	Bacteria
Replicon accession	NC_008786
Strand	-
Start bp	1232666
End bp	1233682
Gene Length	1017 bp
Protein Length	338 aa
Translation table	11
GC content	67%
IMG OID	639848887
Product	substrate-binding region of ABC-type glycine betaine transport system
Protein accession	YP_995901
Protein GI	121608094
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.141218
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCACCACT TGCATCGTCA TCGCTCGCGC CGTCATTTCC TGCGCGCCTG CGCCGCCACT 
GCGGCCATCG CCCATCCCGT CATCGGCATG GCCCAGGGGC TGGCCGCGCA AACCACCATC 
CACTATGGCG GCTCGGCCTG GCTGGGCCAC TATCCGGCTT ATCTGGCGCT GAAAAGCGGC 
ACGCTCCCGG CGGCGTCGAT CGATCTGCGA TGGCAATCCT TCGGCACCTC CTCGGCGCGC 
ATGAGCGCCG TCCTGTCCGG TGGGATCGAC ATCGCCTGCA CCGGCATCGT CTCGGCACTG 
GCGCTGATGG CGCGCGGTTC CAGGCACTTT GCCATCATCG CCGTGCCGGA GGACTTCGGC 
CGCGTCGAGG GCTTGTTTGT CCGCTCCGAT GTCAGCGCCA TCGAGCACCT GAGGGGCAAG 
AAAATCGGCG TGACCTTCGC CTCCAGCGCG CACCTGCTGG TGCTCGACCT GCTGGCTGGC 
GCGGGCCTGG GGCCTGCCGA TGTGACGGTG CTGAATGTGC CGGCCCCGGA GTTGCCTGCG 
GCGATGGCGG CCGGCCAGAT CGATGCGGCG GCGGCATGGA CGCCGCAATT TCACCGGATT 
CGCGCGCTGC CGGGCATCAA GCTGCTCGCC GATGACACGG CGTTCTCGCT GTTCAAGAGC 
CACAAGGTCA CCCCGGGCCC GGATGTTCTG GTGGTGCGCC AGGCGTTTGC CGACAAGAAT 
CCGCTGGCCG TGCGCGGCTT TCTCAAGGGC TATTTCAGTG CCATCGCGAT GCTGCGCGAC 
CGCCCGCAGG AAGCCGCCCG GCAGTTGCTC GCGCTGACCG GCCTGTCGCT GGCAGACCAG 
GTGGAGGCCA TCTTGGGGGC GCAGTGGTAC GGCAGCGAAC AGCAGCGGAA CCTGCTCAAG 
GTGCCAGGCA CCTATGTCGA TGGACTGCAG GGTTTGGCCG ACATGCTGGT GGCGCACAAA 
CAGATCGACA AGGCCCCGGT CGTTGGCCAA TGGATCGATG CCTCGCACTT GGCATGA

Protein sequence

MHHLHRHRSR RHFLRACAAT AAIAHPVIGM AQGLAAQTTI HYGGSAWLGH YPAYLALKSG 
TLPAASIDLR WQSFGTSSAR MSAVLSGGID IACTGIVSAL ALMARGSRHF AIIAVPEDFG 
RVEGLFVRSD VSAIEHLRGK KIGVTFASSA HLLVLDLLAG AGLGPADVTV LNVPAPELPA 
AMAAGQIDAA AAWTPQFHRI RALPGIKLLA DDTAFSLFKS HKVTPGPDVL VVRQAFADKN 
PLAVRGFLKG YFSAIAMLRD RPQEAARQLL ALTGLSLADQ VEAILGAQWY GSEQQRNLLK 
VPGTYVDGLQ GLADMLVAHK QIDKAPVVGQ WIDASHLA