Gene Gdia_0642 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_0642
Symbol
ID	6974039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	729300
End bp	730523
Gene Length	1224 bp
Protein Length	407 aa
Translation table	11
GC content	67%
IMG OID	643390173
Product	Capsule polysaccharide biosynthesis protein
Protein accession	YP_002275049
Protein GI	209542820
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3562] Capsule polysaccharide export protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.696628
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.841432
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGCTGAGTT TCCTGGTGCT GCAGGGCAAT GCCACCCCGT TCTTTTCCGA ATTGGCCGCG 
GCCCTGAAGG CCGCCGGTCA TCACGTCCGT CGCATCGCTT TCAACGGCGG CGATGTCGTC 
TTTTCCTCGG ACGCCACCTG GTTTCGCGGA CGCGAGGAGG CCTTGCCCGC CTTCATCGAA 
GACATCGTGG CGCGCGAACG GCCGGATGCG ATGATCCTGT TCGGCGATTG CCGACCGATC 
CATCGCGTGG CGACCGAGAT CGCCCGCGAG CGGGGCATCG CCATATGGGT GTTCGAGGAG 
GGGTATCTGA GGCCGGGCTG GATTACGCTG GAGCCGCACG GCGTCAATGG ATTTTCCGCC 
CTGCCGCGCG ACGCCGCCGC CATCCGGGCG CGCGGGACCG CACCCTGGCC CGCCCCGCGA 
TACAAGCCGC ATGCCGATTT CCTGCGGCGG TCGGTCTATG ACGTGTCCTA TCACGCCCTG 
CGCGTGGCCC TGACCCCGCT TTTTCCCCAC GCGCGGTTTC ATGCCGCCAT CGACCCGTTC 
GTGGAATATG CGGGCTGGCT GCGGGACTGG GCCGGGCGCC TGGTGCGCAA GCCGCCGCAG 
GCGGTACTGC CCGATGGCCC CTTCATGCTG GTGCCGATGC AGATGGAAGG GGACTACCAG 
CTCCGGGTCC ATTCCCCGTT CCACGGCATG GGCCAGGCGC TGGAGCAGAT TCTGGGCTCT 
TTCGCCGCCC ATGCGCCCGA TACGCTGTCG CTGGTCGTGC GGCGTCACCC GCTCGATCCC 
CGGCTGACGG ACTGGGAGGG GCTGGTCCGT GATCGTGCGC AGGCACTGGG CGTCGCGGAC 
CGGGTTTATT TCATGTCCGA AGGGCCGCTG GAACCGGTCC TGGATTCCTG CATCGGGGTC 
GTGACGGTGA ACAGCACCGT CGGGCTGCTG GCCCTGCGGC GGAACAAGCC GGTCAAAATC 
CTGGGCGAGG CGATCTACGA CGTCGAGGGC TTGACCTTTT CCGGCCCGCT GGGACGCTAC 
TGGCGCGAGG CCTGCGCCCC GGATGCCGGA CTGCTGGACG CCTTCTGCCG CATGCTGATC 
CAGGAGGTGC TGGTCGAGGG TGATTTCTTC ACCCCCGAAG GACGGGCGCT GGCGGTCGAG 
GGATCGGTTC GGCGGATCCT GTCCGCCTAT TCCGACAGGG CCTGCAATTC CCGCACGAGA 
ACCGCCGCCG TCGTTTCGAT CTGA

Protein sequence

MLSFLVLQGN ATPFFSELAA ALKAAGHHVR RIAFNGGDVV FSSDATWFRG REEALPAFIE 
DIVARERPDA MILFGDCRPI HRVATEIARE RGIAIWVFEE GYLRPGWITL EPHGVNGFSA 
LPRDAAAIRA RGTAPWPAPR YKPHADFLRR SVYDVSYHAL RVALTPLFPH ARFHAAIDPF 
VEYAGWLRDW AGRLVRKPPQ AVLPDGPFML VPMQMEGDYQ LRVHSPFHGM GQALEQILGS 
FAAHAPDTLS LVVRRHPLDP RLTDWEGLVR DRAQALGVAD RVYFMSEGPL EPVLDSCIGV 
VTVNSTVGLL ALRRNKPVKI LGEAIYDVEG LTFSGPLGRY WREACAPDAG LLDAFCRMLI 
QEVLVEGDFF TPEGRALAVE GSVRRILSAY SDRACNSRTR TAAVVSI