Gene Gdia_1304 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1304
Symbol
ID	6974709
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	1456075
End bp	1457340
Gene Length	1266 bp
Protein Length	421 aa
Translation table	11
GC content	61%
IMG OID	643390833
Product	hypothetical protein
Protein accession	YP_002275701
Protein GI	209543472
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	59
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCTGA TATCTCATGT CCTTACGATT ATCGTGTGTT CCGTCGGCGT GGCCGTGGCC 
CTGAAACCCG TTGCCGCGCG CGCCCAGGTG ACCATCTTCC AGAAATCCGG CCCCTCATCC 
GATTTCGATG CCTGGCTGCA GGGCATAACC CTGACCGGGC AGATCGAGGG CGGCATCGAC 
GCCAATCCCG CCCGGCCCGA CAACGGCATC AATTTCGGCA ACTTCCTGGG GGACCACGCC 
AATCAGGTGC AGCTCAACCA GGTGGCGCTG ACCCTTGCCA GGGCCATCGA CCCGACGAAG 
GCCGAATACC AGATCGGCTT CACGCTCGAA GCGCTCTACG GCTCGGACGC ACGCTATTAC 
CACCTGCTGG GCATTTCCGA CCACATGACG TCGGACCGCT ATCAGCTCAT TCCCGCCCAG 
GCCCACGTCG ATACCCACCT GCCATGGCTG ACGAAGGGGG GGCTGAACAT GCAGGCGGGC 
ATCCTGCAGG CCCCCATGGG GGTCGAAACC CTGGACCCGA CAACGCGGCC CTTCTATTCT 
CTGGCCTATA CGTCGGAATA TTCGGTGCCG TTCCAGCATG TCGGCGCGAT GTTCAAATGG 
CACGTGATCG ATATGCTCGA CGTCACCTTC GGCATCGATA CCGGCAACCA GACGACGTTC 
GGCCGCAGCG ACAACAATGA CGCACCGGCC GGCTATTTCG GCTTCAACCT GAACAACCTG 
GCACACGGCA AACTGACCAT CATCGAACTC AGCCGTGTCG GACCCGAAGA TTCGGTGAAG 
GTCCTGGGCT CGCCCGCCAA TCACCTGAAT CGATTCTGGA ACGATATCAA CGCGACCTAT 
GCCATCACGG ACAAGCTGTC GGTCACCGGC GAATTCAACT ACCTGCACGA TGACGGGCTG 
CGGGCGGATA CGACCAGCTT CGTCAGCTTC CTCAGCTACA AGATCACGCC GACCCTGACC 
TTCAATTATC GCGGCGAAAT CTATCGCGAC AATACCGGCC TGTTCGTCGC CAGCTTCCTG 
ACCAACCGGG CCTATATGCA GGCCGTCGCC GGCATTCCCG CCCCCGCGGA ATCCGCCCCG 
CCGACCACCT ATGGCGAACT GACGCTGGGC GTCACCTACA AGCCGGATCT GGGCCACCAT 
ATCCGGGTGT TCGAGATCCG GCCCGAAATC CGCTTCGACC GGTCGCTGAA CGGCACGACG 
CCCTTCAACG ACGGACGGAA CACGGGCGTG TTCACGTTCG GCGGCGACGC CGTGCTGGGT 
TTCTGA

Protein sequence

MKLISHVLTI IVCSVGVAVA LKPVAARAQV TIFQKSGPSS DFDAWLQGIT LTGQIEGGID 
ANPARPDNGI NFGNFLGDHA NQVQLNQVAL TLARAIDPTK AEYQIGFTLE ALYGSDARYY 
HLLGISDHMT SDRYQLIPAQ AHVDTHLPWL TKGGLNMQAG ILQAPMGVET LDPTTRPFYS 
LAYTSEYSVP FQHVGAMFKW HVIDMLDVTF GIDTGNQTTF GRSDNNDAPA GYFGFNLNNL 
AHGKLTIIEL SRVGPEDSVK VLGSPANHLN RFWNDINATY AITDKLSVTG EFNYLHDDGL 
RADTTSFVSF LSYKITPTLT FNYRGEIYRD NTGLFVASFL TNRAYMQAVA GIPAPAESAP 
PTTYGELTLG VTYKPDLGHH IRVFEIRPEI RFDRSLNGTT PFNDGRNTGV FTFGGDAVLG 
F