Gene PCC8801_2368 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2368
Symbol
ID	7104638
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	2437238
End bp	2438248
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	38%
IMG OID	643475409
Product	TIM-barrel protein, nifR3 family
Protein accession	YP_002372537
Protein GI	218247166
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0042] tRNA-dihydrouridine synthase
TIGRFAM ID	[TIGR00737] putative TIM-barrel protein, nifR3 family

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTTTCAGT TAAAAGAAAA ATTATCAACT CCCTTAAAAA TTGCCTCGGT GGAGCTAAAA 
AGTCGTGTTT TTCAGTCCCC TTTATCGGGG GTAACTGACT TAGTATTTCG TCGTTTAGTT 
AGACGATATG CCCCTCAATC GATGATGTAT ACTGAGATGG TAAGTGCCAC AGAAATTCAT 
CATCTTAAAG CAATTCCTAG ACTGATGGAA ATTGCACCTG ATGAAGATCC AATTAGTATT 
CAACTATTTG ATTGTCGTCC TGATTTTATG GCAGAAGCAG CAGAAAAAGC AGTCGCTGAA 
GGAGCCAAAA CTATCGATAT TAATATGGGT TGTCCTGTTA ATAAAATCAC CAAAAAAGGC 
GGCGGTTCGT CTTTGCTTCG TCAACCAGAA ATTGCCCAAG CTATTGTTAA AGAAGTGGTT 
AAGACTGTCG ATATTCCTGT CACTGTAAAA ACCCGTATTG GTTGGGATGA TCAAGAGATT 
ACAATTCTTG ATTTTGCAAA AAAAATGGAA GATGCAGGAG CCCAAATGCT AACTATTCAT 
GGCAGAACGC GCGCTCAGGG TTATAATGGA AAAGCTCGAT GGGAATGGAT TGCCAAAGTT 
AAAGAAATTG TCAGTATTCC CGTGATTGCT AATGGAGATA TCTTTTCAGT AGACGCGGCG 
ATTAAGTGTT TAGAAGAAAC TAATGCAGAT GGCGTAATGT GTTCGCGGGG GACGTTAGGG 
TATCCCTTTT TAGTTGGAGA AATTGACTAT TTTTTACAAA CAGGAACTCG ACGGGCTATT 
GTCACTCCTA GTCAACGCTT AGAATGTGCT AAGGAACATT TTAATAATTT GTGGGAATAT 
AAAGGGATTA AAGGAATTTA TCAGTCAAGA AAACATTTAA GTTGGTATTG TAAAGGATTT 
TCTGGTGCAT CAGAATTACG CGATCGCGTC TCCCGTATTG AAACCCTTGA AGAAGGAAAT 
CAATTATTAG ATCATGCCAT AGAATTATGT AGAAAAACTG AAATTAATTA A

Protein sequence

MFQLKEKLST PLKIASVELK SRVFQSPLSG VTDLVFRRLV RRYAPQSMMY TEMVSATEIH 
HLKAIPRLME IAPDEDPISI QLFDCRPDFM AEAAEKAVAE GAKTIDINMG CPVNKITKKG 
GGSSLLRQPE IAQAIVKEVV KTVDIPVTVK TRIGWDDQEI TILDFAKKME DAGAQMLTIH 
GRTRAQGYNG KARWEWIAKV KEIVSIPVIA NGDIFSVDAA IKCLEETNAD GVMCSRGTLG 
YPFLVGEIDY FLQTGTRRAI VTPSQRLECA KEHFNNLWEY KGIKGIYQSR KHLSWYCKGF 
SGASELRDRV SRIETLEEGN QLLDHAIELC RKTEIN