Gene Gdia_1402 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1402
Symbol
ID	6974810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	1565119
End bp	1566339
Gene Length	1221 bp
Protein Length	406 aa
Translation table	11
GC content	67%
IMG OID	643390932
Product	hypothetical protein
Protein accession	YP_002275797
Protein GI	209543568
COG category	[S] Function unknown
COG ID	[COG5441] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	64
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATCCCGT CCGTCTATCT TCTGGGAACG GCGGATACCA AGTTCGCGGA ACTGGACTAT 
CTGCGATCGG TCCTGACCGG ACGGGGCGTC GGCAGCCATA TCGTGGATGT CGGCACCCGC 
GAGGACCCGT GCGCCGCCGA CATCACCGCG CGACAGGTGG CGGCCTGCCA CCCCGATGGC 
GCTGCCGCGG TCTTCTGCGG CGAGCGCGGG CGCGCCATCG CGGCGATGTC CGAGGCGCTG 
CGGCGTTTCC TGCCGGGCCG CGCCGACCTG GCCGGCGTGA TCGCGATCGG CGGCTCCGGC 
GGCACGGCCC TTGTCGCGCC GGCCCTGCAG GACCTGCCGA TCGGCCTGCC CAAGATCCTG 
GTTTCCACCG TCGCATCGGG AAACGTGGCG CCCTATGTGG GCGAATCCGA TCTGTCCATG 
GTCTATTCGG TCGTCGACCT TCAGGGGCTG AACCGTATTT CGCGCACCAT CCTGGCCAAC 
GCCGCCAACG CCATGGCGGG CATGGTGCTG CACCCCGCGC CGCATGATGC CGGCACGCGT 
CCGGCGGTGG GCATCACCAT GTTCGGCGTC ACCACACCCT GCGTTACGGA GGCGATGCAT 
ATCCTGACAG GGGATTTCGA ATGTCTTGTC TTCCACGCCA CCGGAACCGG CGGGCGGTCG 
ATGGAACGGC TTGTGCGCCA GGGCATGATC GGCGGCGTGC TCGACATCAC CACCACCGAG 
TTCTGCGATT TCGTCGCGGG CGGCATCTTC CCCTGCGAGG CCGGGCGCCT GGATGCCGTC 
GCCGCGACCG GTGTGCCCTA TGTCGGAAGC TGCGGCGGGC TGGACATGGT CAATTTCGGC 
GCCCGGGATA CGGTGCCGGA CCGGTATCGC GACCGGGTTT TCGTGCAGCA TAATCCGTTC 
ATCACGCTGA TGCGCACGAC GGCCGAGGAA TGCGGGCAGA TGGGACGCCT GATCGGCGCG 
CGCCTCAACC GCTGCCACGG GCCCGTGCGC TTCTATTATC CGGAAAAGGG CTTTTCCCAG 
CTCGATCGTC CTGGTCAGCC CTTTCACGAT CCGGCGGCGG ACGCGGCCTT CCGCGACGCG 
CTGGCGTCCA CGCTGGAACA GACCGATCGG CGGCGTTTCA TCAGCCTGCC GCTTGCCCTG 
AACGACCCGG CCTTCGCCCA GGCCATGGTC ACGGAATTCC GCACCCTTTT CGAGGAGAGT 
CATCCCTATG CCCCGCATTG A

Protein sequence

MIPSVYLLGT ADTKFAELDY LRSVLTGRGV GSHIVDVGTR EDPCAADITA RQVAACHPDG 
AAAVFCGERG RAIAAMSEAL RRFLPGRADL AGVIAIGGSG GTALVAPALQ DLPIGLPKIL 
VSTVASGNVA PYVGESDLSM VYSVVDLQGL NRISRTILAN AANAMAGMVL HPAPHDAGTR 
PAVGITMFGV TTPCVTEAMH ILTGDFECLV FHATGTGGRS MERLVRQGMI GGVLDITTTE 
FCDFVAGGIF PCEAGRLDAV AATGVPYVGS CGGLDMVNFG ARDTVPDRYR DRVFVQHNPF 
ITLMRTTAEE CGQMGRLIGA RLNRCHGPVR FYYPEKGFSQ LDRPGQPFHD PAADAAFRDA 
LASTLEQTDR RRFISLPLAL NDPAFAQAMV TEFRTLFEES HPYAPH