Gene Gdia_1034 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1034
Symbol
ID	6974431
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	-
Start bp	1163972
End bp	1165027
Gene Length	1056 bp
Protein Length	351 aa
Translation table	11
GC content	61%
IMG OID	643390556
Product	putative replication protein
Protein accession	YP_002275432
Protein GI	209543203
COG category	[L] Replication, recombination and repair
COG ID	[COG5534] Plasmid replication initiator protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.135734
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	50
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCCCGA CGGGCAGAAC GCGCTCCGAG CGCGAGCAAC TGGAACTCTT CCACGCTATC 
GCGGGAGATT TCGCGCCTCG CGATGCGCAG GATCTGATGG CGTTTCCGTT CTTCAGCCTC 
GCCAAATCCC CTCGCATGGT CCCGATCGAT TATCGGACCC CCGATGTCAC GATCCGCGTC 
GAGGCGTCCG CCGAACATGG CATGGCCACG ATCTGGGATG CCGACGTGCT GATCTGGGCC 
GCCAGCCATC TCGTTGCCGC GCGCGACGCC GGTCGGCGCA CGTCGCGGCT GATGATGGCC 
AGCCCGCGCG AGATCCTGAC CTTCATCGGT CGGGGCGACA GCGCGCGGGA CTATGAGCGG 
CTGGAAGCAG CCTTCGATCG GCTGCAATCC ACCACGATCA AGACCTCGCT GCGGCAGACC 
GGCAAGGGGC AACTGCACCG CTTTTCCTGG ATCAACGAAT GGAAGCGACA TACCGCGCGG 
GAAGGCCGCA CCCGCGTGAT CGAACTGATC CTGCCCGACT GGTTCTACCA GGCGGTGCTC 
GATGACGCGC TCGTTCTGAC CATCGATCCG GCCTATTTTA ACCTCACCGG CGGTCTGGAG 
CGCTGGCTAT ATCGCATCGT GCGCAAGCAT GGTGGTCGTC AGCGCGCGGG CTGGGCCTTC 
GGCCTTCGCC ATCTCTACGA AAAATCCGCC AGCCTTTCCC CCTATCGCCG CTTTGCCTTC 
GAACTGCGCG AGATGGCGAA ACGGCAGCCC TTTGCCGGCT ATCGGCTGTC GGTGCGCCCC 
GACCGCAACG GCAATGACTC GCTGGCCTTT GCACCTGTCA AACTATCCAC AGGCGCCTGT 
GGACAAGCTG TGAATTCATC CGTGCTATCA GTTGTGGATT TATCCGTGCC ATCACTGCCA 
CCGCATCCGT GCTATCGTTT GCGGAAAACG CCGAATCACA ACATTGAATC AAGTGGTTAT 
GACGCCCTTA ACTTAGAATC TAACTTAAAA GAGTCTAACT TTAAGGATGT TGGCCCCCCC 
GCCGATCCGT GGATAAGCCC CGGAGAGGGG TCATGA

Protein sequence

MSPTGRTRSE REQLELFHAI AGDFAPRDAQ DLMAFPFFSL AKSPRMVPID YRTPDVTIRV 
EASAEHGMAT IWDADVLIWA ASHLVAARDA GRRTSRLMMA SPREILTFIG RGDSARDYER 
LEAAFDRLQS TTIKTSLRQT GKGQLHRFSW INEWKRHTAR EGRTRVIELI LPDWFYQAVL 
DDALVLTIDP AYFNLTGGLE RWLYRIVRKH GGRQRAGWAF GLRHLYEKSA SLSPYRRFAF 
ELREMAKRQP FAGYRLSVRP DRNGNDSLAF APVKLSTGAC GQAVNSSVLS VVDLSVPSLP 
PHPCYRLRKT PNHNIESSGY DALNLESNLK ESNFKDVGPP ADPWISPGEG S