Gene Gdia_2501 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_2501
Symbol
ID	6975930
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	2751044
End bp	2752090
Gene Length	1047 bp
Protein Length	348 aa
Translation table	11
GC content	62%
IMG OID	643392018
Product	integrase family protein
Protein accession	YP_002276860
Protein GI	209544631
COG category	[L] Replication, recombination and repair
COG ID	[COG4974] Site-specific recombinase XerD
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	18
Plasmid unclonability p-value	0.137002
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	35
Fosmid unclonability p-value	0.0538174
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCCCCGCA AAAGACCAGA TCGGCCATTT CTGGAACTCT ATCGAGGGAC GTGGTGCGTC 
GTCTGGTGGG AGAGCGGAGA GCGCAAGCGA AGCTCGACGG GTACTGCGGA TGAAGAGGGC 
GCTCGGCGCG CTCTAGCCGA CTTCGAAGCG GCGCTGTCAG CACGTCCGAA CGGTCAGCTT 
CTATCTGAGG CGCTTGATAT TTACGTTTCG GCCCGGGCTG GGAAGGTGAC GGCCCTCAGC 
CGCCTCGAAG AGGCGGCTAT TCGCATCAAT GAGGGAATGG GGCATCTTCG GATCAACCAG 
ATCCATCAGC GCCAATGGGA CGATTACGCA GCAAGCCGCT TTCGCAAGCC GAATGCGCGG 
AGCAAGCGCC CAGTCGAGGG GGCGCCCGTC CCGATATCGC TCGGAACCCT GAAGCGGGAA 
TTCAACGTTC TACGCGCGGC GCTGCGTCAC GCCTGGCGTA ATCACAGGCT CGACAAGCCG 
CCGACTTTGG AGGGGCCGGG AGGCAGCGCG CCGCGCGATC GCTACATCAC CAAGGCCGAG 
GCTCGCCGCC TTTTGGACGC TTGCGAGACG CCGCATATCC GCGCGTTTCT GGCGCTGGCG 
ATGTTCACGG GCGCGCGAAA GGGATCGATT CTCGCTCTCA CTTGGGATCG GGTGATGTTC 
GATCTGGGTC GCATCGACTT CCAGGAACCT GGGCGGAAGT TGACGGCCAA GCGCCGTGCA 
ATCGTCCCGA TGACGGATGA CCTGCGGGCA GAATTGACCG AGGCGCACAA GGTCCGGACA 
TGCGACTATG TGGTCGAATG GGCTGGAGGT CCCATCACCT ATGGCATCCG CTGGCCATTG 
AAAAAGTTGG CGCAGAAGGC TGGTCTGTCA TGGACGCCCA CGCCCCATCA CTTCAAGCAC 
AGTGTGGCGT CATGGATGGC CATGGCCAAG GTGCCTATTG ATCAGGCGGC CGACTGGCTT 
GCCACCGATC CCAAGACGCT GCGTCGAGTC TACCGGAAAT TCGATCCGGA TTATCTGCGG 
GAGGTAGGGT CTGCCCTGAA ACTATAG

Protein sequence

MPRKRPDRPF LELYRGTWCV VWWESGERKR SSTGTADEEG ARRALADFEA ALSARPNGQL 
LSEALDIYVS ARAGKVTALS RLEEAAIRIN EGMGHLRINQ IHQRQWDDYA ASRFRKPNAR 
SKRPVEGAPV PISLGTLKRE FNVLRAALRH AWRNHRLDKP PTLEGPGGSA PRDRYITKAE 
ARRLLDACET PHIRAFLALA MFTGARKGSI LALTWDRVMF DLGRIDFQEP GRKLTAKRRA 
IVPMTDDLRA ELTEAHKVRT CDYVVEWAGG PITYGIRWPL KKLAQKAGLS WTPTPHHFKH 
SVASWMAMAK VPIDQAADWL ATDPKTLRRV YRKFDPDYLR EVGSALKL