Gene Gdia_1887 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1887
Symbol
ID	6975310
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	2103384
End bp	2104343
Gene Length	960 bp
Protein Length	319 aa
Translation table	11
GC content	66%
IMG OID	643391413
Product	NMT1/THI5 like domain protein
Protein accession	YP_002276262
Protein GI	209544033
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.50224
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	34
Fosmid unclonability p-value	0.0288593
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGACCGGAT TGCTGCGCGT GTTGACAGGT CTGGCGGTCC TGTCCCTGTC CGTCCTGTCT 
CCAGCCCGTG CCCAGGTGCC GGACACGGTG ACGGTCATTC TCGACTGGTT CCTGAATGCC 
GATCACGCGG CGCTTCTGGC GGCCGACTAT AGCGGCGCGT TCCGCCGGCA TGGATTGCAG 
GTGCACCTGA TCGCCCCGTC CGATCCCGGG TCCCCCGCGC GGCTGGTGGC GGCGGGGCAG 
GCGGATCTGG CGGTGTCCTA CGAAACGCAG CTGGGCATGC TGGCCGAGCA GGGGATTCCG 
CTGGTGCGGG TGGGCACGCT GATCGACACG CCGCTGGATA CGCTGATCAC CGGGCCGGAC 
ATTCATTCCC TGAAGGACCT GAAGGGCAGG ACGATCGGGA TTTCCATGGC GGGGGTCGAC 
GACGCGGTGC TGGCGGCCAT GCTGGGGTCG GTCGGGCTGT CCCTGTCCGA CGTGCATCAG 
GTCAACGTCA ATTTCCAGTT GGAACAGGCC CTGATGTCAC ACGCGGTCGA TGCCGTGATC 
GGGGCGACGC GCACCTATGA ACTGATCGAC CTGCGGCAGA AGGGATTCGC CCCCGGCGCG 
GTCTATCCCG AGGAACATGG CGTGCCGCTG AATGACGAAC TGATCTTCCT GGCCGCGCGC 
GACCATGCCC ATGACCCCAG GATCGTCCGC TTCATGGACG CGCTGGAGGA GGGGACGAAC 
GTCCTGCTGA ACCATCCGGA CGATATCCTG GCCCAGGCCG TCCGGGAGCA TCCCGAACTG 
GATACGAAGC TGAACCGTGC CGCCTGGACG GCGACCCTGT CGCGCGTCTG CAAGCAGCCC 
TCGGTCCTGA ATGCGCGGCG CTATCGGGCG TTCATGGCAT TCCTGCGTGC CCGCGGCGTG 
GTGCATCGGG ACATGAACCT GTCCGACTAC GCCGTCGATC CGGCTGACGG CACGCCGTAG

Protein sequence

MTGLLRVLTG LAVLSLSVLS PARAQVPDTV TVILDWFLNA DHAALLAADY SGAFRRHGLQ 
VHLIAPSDPG SPARLVAAGQ ADLAVSYETQ LGMLAEQGIP LVRVGTLIDT PLDTLITGPD 
IHSLKDLKGR TIGISMAGVD DAVLAAMLGS VGLSLSDVHQ VNVNFQLEQA LMSHAVDAVI 
GATRTYELID LRQKGFAPGA VYPEEHGVPL NDELIFLAAR DHAHDPRIVR FMDALEEGTN 
VLLNHPDDIL AQAVREHPEL DTKLNRAAWT ATLSRVCKQP SVLNARRYRA FMAFLRARGV 
VHRDMNLSDY AVDPADGTP