Gene Gdia_3390 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3390
Symbol
ID	6976836
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3714261
End bp	3715214
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	68%
IMG OID	643392906
Product	Mammalian cell entry related domain protein
Protein accession	YP_002277731
Protein GI	209545502
COG category	[Q] Secondary metabolites biosynthesis, transport and catabolism
COG ID	[COG1463] ABC-type transport system involved in resistance to organic solvents, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	36
Fosmid unclonability p-value	0.0881876
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCCCAGG ATCAAAAGAC CGACCTGGCG CGCCAGTTGG TGCGCGTGCG CTATGCCGAC 
GAATGGGTCG GCGTGCTGGT CCTGCTGTCG CTGGTGATCT GCTTCGCCGC GATCGTCGAG 
GCCGGGGTCC TGCGCGACTG GCTGACACCC GCCGGCCGGC TGCAGATCGT CCTGCCCGAC 
GGCGGGGTCA GCGGCCTGTC GGTGGGTAAC GATATCGAGG TGCTGGGCAT CCATGCCGGC 
ACGATCCGGC GCATCCGCAT CAATCCCTCG GGCGGGATGT TCGCGGTGGC CGATATCGAC 
CCGGATATCG AACCCTATAT CCGCCGTGAC AGCACGGCCA CCATACGCCG GCGCTTCGTC 
GTGGCGGGGG CGGATTACAT CGACATCTCG CGCGGCACCG GCACGCCGAT GGACTGGCAT 
TACGCGGTGC TGACCGCGCA CAGCGCCCCC AACCCCGCCG ACATGATCAC CCAGACCTTC 
GCCGATATCA GGGCGCGCAT CCTGCCGGTG CTGGACAGCT CCCAGCACAT GATGTCGCAG 
CTCGACGCCA CGATCACCGA CATGCATTCC GGCAAGGGCA CGGTGGGGCG CCTGATGACC 
AGCGACGACC TGATCCGCCA GTCGGAAAAG ATGGTCGCCT CGCTCAATAC CGCCATCGCC 
CAGTTGACCC CGGTGGAAAA GCGGCTGTCG GCGGTGATGG CCAAGGCGGA CAGTTCCATG 
GCCAATGTCC GTGCGTCCAC CGACGATCTG CGCAAGGCGA CGCCGCGCCT GCCGGCGATC 
ACCCGCGACC TGCAGGAGAC TTCGGCCGAA CTGCCGGTCC TGCTGACCCA GGCGCAGGTC 
ACGGCGGCCA GCCTGCAGAA GCTGACCGAC CAGCTTCGCG GCCTGTGGCT GCTGGGCGGC 
GGGGGCACGC CCGCGCCACA GCGGCGCCTG CCGGCCGCGA GAATCCAGCC ATGA

Protein sequence

MAQDQKTDLA RQLVRVRYAD EWVGVLVLLS LVICFAAIVE AGVLRDWLTP AGRLQIVLPD 
GGVSGLSVGN DIEVLGIHAG TIRRIRINPS GGMFAVADID PDIEPYIRRD STATIRRRFV 
VAGADYIDIS RGTGTPMDWH YAVLTAHSAP NPADMITQTF ADIRARILPV LDSSQHMMSQ 
LDATITDMHS GKGTVGRLMT SDDLIRQSEK MVASLNTAIA QLTPVEKRLS AVMAKADSSM 
ANVRASTDDL RKATPRLPAI TRDLQETSAE LPVLLTQAQV TAASLQKLTD QLRGLWLLGG 
GGTPAPQRRL PAARIQP