Gene Gdia_2023 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2023
Symbol
ID	6975450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	2244526
End bp	2245650
Gene Length	1125 bp
Protein Length	374 aa
Translation table	11
GC content	71%
IMG OID	643391553
Product	hypothetical protein
Protein accession	YP_002276398
Protein GI	209544169
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG4421] Capsular polysaccharide biosynthesis protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.426657
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	56
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTTCCCT CTTTCCTGCA ACGCGCTCGC CGGGTGGCGC GGTCCGGCCC GGACCGGGTC 
GGGATCGCGG CGGTCGCGGA CGGCGTCACC ATCCTGGAAA CCTGTCCGGC CCTGCCCGCC 
CGCTTCGCCG GCGGCGCGAT GCGCGGGCGG GGGGCGAATC CCTTCCTGGA CTGGACGAGT 
ACGCCGGTCA CGGTGACGGT TCATGACCTG CGCGACGTCG TCTACGATGT CGATCATCGG 
GTGCTGATCA AGGATGGGCG CCTGATCGCC GAGACCTGCT ACCTGCAGCC GGAGGACGCG 
CTGGCCCGGG TCGTCGCCGC CCGCGCGCGA CCGGACCGCC TGGCAGGCCG GGGAATAATG 
GTTCCGTGCA GCGATCATTG GCCGGGCAAT TACTATCACT GGATGGCGCA TGGCCTGCCG 
GTGATCGCCG CCGCGTCGGA CCTGCCGGAT GGCGGCGCGG CACGGCTGCT GCTGCCGGCG 
CTTCTGCCCT GGCAGCATCG CACGCTGCAG ATGCTGCGGC CCGGAGGATG CGCGATCGAA 
CGGATCATGG CGGGGCGGCA ATACCGGATC GACCGGGTCG CCTATTGCAA CATCGTCGCC 
GGGGCGGCCG ACTTCGCGGT GTCACGGCTG TGCGGGCGGG TATTCGCACG CCTGGCGGCG 
GCCGTTCCCG TCGTCCGGCC GCATGGCGCG CGCCTGTATG TCGATCGCGG CGGGGCCGGC 
CATCGTGCCA TCCCGAACGA GGGCGCGCTG GCCGCGCGGC TGCGCGGCCT GGGGTTCCTG 
GCGGTCCGGC CCGAAACCCT GACGGTGGCC GAACAGATCG ACCTGTTCCG GGCCGCGTCG 
ATGGTGGTGG GGCCACTGGG CGCCGGCATG ACCAATATCG GATTCTGCCG CCCCGGGACC 
GTGGTCTACG ACCTGGTCCC GGACCATCAC GCCAACCCGT GCTTCCTGGC CATGGCCATG 
CGCGGCGGCC TGGAATACTG GGCGGATCTG TTCCCGACCG GGGCGGCGCG ACAGGACCAT 
ATGGCCCCCT GGGGGCAGGG GATCGACGTC GAAAGGGTGG TTCGGCGGGT GGAGGAACTG 
CTCAGGGGGC TTTTGCCGGG CGCAGGTGCT GCGCCCCTGC CGTGA

Protein sequence

MFPSFLQRAR RVARSGPDRV GIAAVADGVT ILETCPALPA RFAGGAMRGR GANPFLDWTS 
TPVTVTVHDL RDVVYDVDHR VLIKDGRLIA ETCYLQPEDA LARVVAARAR PDRLAGRGIM 
VPCSDHWPGN YYHWMAHGLP VIAAASDLPD GGAARLLLPA LLPWQHRTLQ MLRPGGCAIE 
RIMAGRQYRI DRVAYCNIVA GAADFAVSRL CGRVFARLAA AVPVVRPHGA RLYVDRGGAG 
HRAIPNEGAL AARLRGLGFL AVRPETLTVA EQIDLFRAAS MVVGPLGAGM TNIGFCRPGT 
VVYDLVPDHH ANPCFLAMAM RGGLEYWADL FPTGAARQDH MAPWGQGIDV ERVVRRVEEL 
LRGLLPGAGA APLP