Gene Gdia_3147 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_3147
Symbol
ID	6976585
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	3445341
End bp	3446435
Gene Length	1095 bp
Protein Length	364 aa
Translation table	11
GC content	70%
IMG OID	643392659
Product	hypothetical protein
Protein accession	YP_002277492
Protein GI	209545263
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	32
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	37
Fosmid unclonability p-value	0.162814
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAGTC GATCCGCGTG GGGATTGTCG CGCCGCCGGG TGCTGATCGC AGGGGCGGGC 
GCGGGGGGCG CGGCCGCGCT GGCGGGCGGG CTGGCGGTGC GCCACCGGCT GCATCATCAG 
GCGGTCACTC ATCACAAGGT GCTGCCCGAC GGGCGTTTCC GCCGGCTGGC GCTGTCCTGG 
CCGTCCTCGA ACATGCTGGT CTTCGCGGTG GCGCGGCAGC ATTTCTTTGC CGCCTACAAT 
CTGGACGTGG CGCTGGTCGG CGGTGCGCGC AGCGGGCGGG CCGCCATTGC CGACATGGTT 
GCCGGCCGGG CGGTGGGCGC GGCATCCCCG ATCCTGACCT GGCTGGACGT GATGCGGCTG 
GGGGGAGTCC AGGCTCGTCT GGTCAGCGGC CTGCAATCCG GCACCTTCCG TTTGCTGGTC 
CGGCGCAAGC TCAAGGTCGT GCGGCTGGAC GGCATCGCGG GGCTGCGAAT CGCGGTAGTG 
GATCAGGACA TGGCCGACCG GCTGTTCTTC TCGGTCATGA TGCGGCGCAA GGGAATCGAC 
CCCGAGGCAT CGGTGCGCTG GGTCACCCTG CCACCCGAAC AGGCGATGGA TGCCGCCCGG 
GCGGGCGAGA TCGACGCCGT GGCCGCGCAC GACCCGCTGG CGTGGCAGTT GCTGCACGGG 
ACGGATTCGC CGTTCTTCGA ACTGGCCAAC AGCACGACGG GTCATTACGG CGAGCGTGCC 
AACCTGGCGC TGGGCCTGTC GGATTCGCTG CTGCAGTCCG ATCCGGCGGC GGCGGCGGCA 
TTGGTCATGG CCCTGCGCGC GGCGTCGGAC TGGATCAAGG CCCATCCCGA CCAGGCGGCC 
AGCCTGATGA CGGGGCAGAT TCCGGGCATG GAGACCGGCG ACATCCTGTC CATGCTGCGG 
CACGAGACAT TGGGCATCAG CCCCGTGGGG AACGACCTGC GGGTGCAGGT GGCGCAATAT 
GTGGATGAAA TGAAGCTGCT GGGCCGCGTG CCCGATACGG TCGGATCGTC GGCCTATGCC 
AGGCGGGTCT GCGCCAATGC CCTGGTCACC GATACGCCCG CCGCGCTGTG GCCGCAGGCG 
GTCGGGCCCA CATAG

Protein sequence

MGSRSAWGLS RRRVLIAGAG AGGAAALAGG LAVRHRLHHQ AVTHHKVLPD GRFRRLALSW 
PSSNMLVFAV ARQHFFAAYN LDVALVGGAR SGRAAIADMV AGRAVGAASP ILTWLDVMRL 
GGVQARLVSG LQSGTFRLLV RRKLKVVRLD GIAGLRIAVV DQDMADRLFF SVMMRRKGID 
PEASVRWVTL PPEQAMDAAR AGEIDAVAAH DPLAWQLLHG TDSPFFELAN STTGHYGERA 
NLALGLSDSL LQSDPAAAAA LVMALRAASD WIKAHPDQAA SLMTGQIPGM ETGDILSMLR 
HETLGISPVG NDLRVQVAQY VDEMKLLGRV PDTVGSSAYA RRVCANALVT DTPAALWPQA 
VGPT