Gene Syncc9605_2030 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_2030
Symbol
ID	3737706
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	+
Start bp	1846747
End bp	1847748
Gene Length	1002 bp
Protein Length	333 aa
Translation table	11
GC content	66%
IMG OID	637776616
Product	dihydrouridine synthase TIM-barrel protein nifR3
Protein accession	YP_382325
Protein GI	78213546
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	28
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGATTGCTC TACCCCCTCT GCAGCTACCC GGCAATGGCA TCGCACGTCA GCTGCGCTGC 
CGCGTGTTGC AGTCGCCGCT GGCAGGGGTG AGCGATCGAG TGTTTCGCAG CCTGGTTCGA 
CGCTGGGCGC CCGATGCCCT GTTGTTCACC GAAATGGTGA ATGCCACCAG CCTCGAGATG 
GGGCATGGAC TGTGCAAGGT GGAATCGCTC GCCGAGGAAT CCGGCCCCAT CGGCGTGCAA 
CTGTTCGACC ATCGCCCCCA GGCCATGGCC GATGCGGCAC GACGGGCCGA AGCCAGTGGC 
GCCTTTCTGA TCGACATCAA CATGGGCTGC CCGGTGCGGA AGATTGCCCG CAAAGGGGGC 
GGTTCCGGGT TGATCCGTGA TCCCGGGCTG GCCATTCAGA TCGTGGAAGC GGTGGCGGAC 
GCGGTGGCCG TGCCTGTCAC GGTGAAGACA CGCCTGGGTT GGTGTGGCAG TGATGCCGAT 
CCCGTGCACT GGTGCCAGCA ATTGGAACAA GCCGGGGCAC AACTTCTCAC TCTGCATGGA 
CGCACCCGCG AGCAGGGCTT CAAGGGTGCC GCCGACTGGA GCTCCATCAG GCAGGTGCGG 
GAGGCCCTCA CGATCCCGCT AATCGCGAAC GGCGACATCA ACAGCCCCGA CGATGCCCTG 
CGCTGCCTGA AACAGACCGG CGCAGCGGGC GTGATGGTGG GCCGAGGCAC GATGGGGTCC 
CCATGGTTGG TGGGTCAGAT CGACGCCGCC CTAGCCGGTC GCTCGATCCC CGCCACGCCG 
GATCCCTCAG CACGACTTGC GCTGGCCCGC GATCAATTGG ATGGCCTCGT GCAGGATCGC 
GGTGACCACG GGCTGCTGAT TGCCCGCAAA CACATGGGAT GGACCTGCAC GGGCTTCCCC 
GGCGCCTCGC GACTGCGTCA TGACCTGATG CGGGCACCCA CACCCGCCCA GGCCAGGGAT 
CTGCTTACTC AGCAGATCGA TGCCCTTGCC GCGTCCGCTT GA

Protein sequence

MIALPPLQLP GNGIARQLRC RVLQSPLAGV SDRVFRSLVR RWAPDALLFT EMVNATSLEM 
GHGLCKVESL AEESGPIGVQ LFDHRPQAMA DAARRAEASG AFLIDINMGC PVRKIARKGG 
GSGLIRDPGL AIQIVEAVAD AVAVPVTVKT RLGWCGSDAD PVHWCQQLEQ AGAQLLTLHG 
RTREQGFKGA ADWSSIRQVR EALTIPLIAN GDINSPDDAL RCLKQTGAAG VMVGRGTMGS 
PWLVGQIDAA LAGRSIPATP DPSARLALAR DQLDGLVQDR GDHGLLIARK HMGWTCTGFP 
GASRLRHDLM RAPTPAQARD LLTQQIDALA ASA