Gene Gdia_1631 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Gdia_1631
Symbol
ID	6975047
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Gluconacetobacter diazotrophicus PAl 5
Kingdom	Bacteria
Replicon accession	NC_011365
Strand	+
Start bp	1811672
End bp	1812610
Gene Length	939 bp
Protein Length	312 aa
Translation table	11
GC content	61%
IMG OID	643391167
Product	CRISPR-associated protein, Csd2 family
Protein accession	YP_002276024
Protein GI	209543795
COG category	[L] Replication, recombination and repair
COG ID	[COG3649] Uncharacterized protein predicted to be involved in DNA repair
TIGRFAM ID	[TIGR01595] CRISPR-associated protein, CT1132 family [TIGR02589] CRISPR-associated protein, Csd2 family

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.835293
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	45
Fosmid unclonability p-value	0.948126
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACTGAAG CGACCGCCAT GCAGAATCGC CATGAATTCG TACTGTTCTT CGACGTTACC 
AACGGAAATC CGAATGGAGA CCCGGATGCA GGCAACATGC CGCGCCTGGA CCCGGAAACC 
AATCAGGGCC TGGTGTCCGA CGTCGCGCTG AAACGCAAGG TCCGGAACTA CGTGTCGCTG 
GCCCGGCCCG ACATGCCGGG ATTCGAAATA TACATGAGCG AAGGGATGGC CCTGAACAGG 
CAGCACCGAA AGGCATGGAA CGCAATCATG CCTGAAGTGA CCAAGGACGA GTCCTTCAAG 
ACCCTTCCGA AGGACGAGGA CAAGGCACGC GCCCTGACAC GATGGATGTG CACCAATTTC 
TGGGACATCA GGACGTTCGG TGCGGTGATG ACGACCAGCG TCAATTCGGG ACAGGTACGC 
GGGCCGGTGC AGTTTTCGTT CGCCCGTTCG GTGGAGCCGG TCCTGCCGCT GGAAATCGCC 
ATCACGCGCA TGGCCGCCAC GACCGAGGCC GACGCCGAAA GCAAGGGTGG CCGGACAATG 
GGGCGCAAGC ATATCGTGCC TTACGGGCTG TATCGCATGC ATGGCTACAT CTCCGCCCCC 
CTGGCATCGC ATCCCGTCAA GGGAACAGGT TTTTCGGAAT CGGACCTCGA ACTGCTGTTG 
GAGGCCCTGA CCGGCATGTT CGATCATGAC CGATCCGCCG CGCGGGGAGA GATGGCAACG 
CGCAAGCTGA TCGTATTCCG CCATGAATCG GCGCTGGGTA ACGCGCGGGC CCAGGATTTG 
TTCGATCGGG TTACGGTGCA ACGCGCCTAT CAGGGCAGCG CACATCCGAT TGGCAGTGCG 
GCCATCGACA ACTGGCCGCC TGCCCGGGCC TGGGGCGATT ATCAGGTGCT GATCGACCGG 
GACGCAGTAC CGGCGGGAAT CGAGATCATC GAACGGTAA

Protein sequence

MTEATAMQNR HEFVLFFDVT NGNPNGDPDA GNMPRLDPET NQGLVSDVAL KRKVRNYVSL 
ARPDMPGFEI YMSEGMALNR QHRKAWNAIM PEVTKDESFK TLPKDEDKAR ALTRWMCTNF 
WDIRTFGAVM TTSVNSGQVR GPVQFSFARS VEPVLPLEIA ITRMAATTEA DAESKGGRTM 
GRKHIVPYGL YRMHGYISAP LASHPVKGTG FSESDLELLL EALTGMFDHD RSAARGEMAT 
RKLIVFRHES ALGNARAQDL FDRVTVQRAY QGSAHPIGSA AIDNWPPARA WGDYQVLIDR 
DAVPAGIEII ER