Gene PCC8801_2202 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2202
Symbol
ID	7102450
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	2277057
End bp	2278343
Gene Length	1287 bp
Protein Length	428 aa
Translation table	11
GC content	45%
IMG OID	643475256
Product	dihydroorotase
Protein accession	YP_002372386
Protein GI	218247015
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

TTGAATACTT CTACTGTATT TCGTCAAGTC CGCGTATTAG ACCCTTTCGC TAATACAGAC 
ATGATCGCCG ATGTTTGGCT CAATGATGGT AAAATTCAAG CCATTGACCC GCATCTTAAC 
GTTATTTCCC CAGAAACAAC TATTATTGAG GCACAAGGAT TAATTCTCGG AACAGGGTTA 
GTTGACCTCT ACAGTTATAG TGGAGAACCG GGGTTTGAAG ACAGGGAAAC CTTAACTTCT 
CTTGCTGCTG CGGCTATTGC TGGAGGGTTT ACCCGTGTCG CTATCTTACC TCAGACTAAA 
CCCGGGGTTG ATAATGCCGC GACTTTCTCT TTTTTACAAC AAAAAGCCCA AACTTTGCCT 
AATTCCCCCC ATCTTCATTT TTGGGGAAAC CTCACCCTAG GGGGACAAGG GAAACAAATG 
ACAGAATTAG CCGAATTAGC GATGGCTGGC GTGGTGGGGT TTACGGACGG TCAAAGTATC 
GAGAATTTGG GCTTATTAAG ACGAATTTTA GAATATTTAA AACCATTAGA AAAACCCGTG 
GCCTTAGTTC CTGAGTCTTC CTCTCTCAAA GGGAATGGAG TCATGCGAGA GGGACTCCTT 
TCCATTCACT ATGGACTCCC TGGAAACCCT GCGATCGCTG AATCTTCGGC GATCGCTACT 
ATTTTAGAGA TAGTAGCCGA AATTAATACC CCCGTCCATC TCATGGGTAT TTCTACCCGT 
CGCGGGGTGG AATTAATGGC CTCAGCAAAA GCGAGAGGTC TACCCATCAC AGCAAGTACC 
TCTTGGATGC ACTTACTCCT AGATACTCAC GATATTTCCA ATTATGACCC TAGTTTACGC 
TTAGAACCGC CTTTAGGCAA CCCCGAAGAT CGTCAAGCGT TAATTGAGGG AGTCAGAGAG 
GGAATTATTG ATGCGATCGC CGTTAACCAT CGTTCCTTGA CCTATGAAGA GAAAACGGTC 
GCTTTTGCTG AAGCTCCAAC GGGGGCGATC GGGTTAGAAT TAGCCTTACC CTTATTATGG 
GATCAATTAG TCGTTCAGGG GGAATGGTCG CCCCTACAAT TATGGAAGGC TTTAAGTTGT 
TACCCTTGTC AATGTTTAGG GTTAGAAGTC GCGGGTTTAC AAGTAGGACA ACCGGCCGAA 
TTAATTTTAT TTGATCCCCA AAAAACTTGG CAAGTAGACG GGACAACTCT TCAGTGTTTA 
GGAAGGAATA CCCCTTGGTA TCAACAGGAA ATTAAGGGAC GAGTGATCAC CTCATTCGTT 
GGCAAAGAAA ATAATACCCT GACCTGA

Protein sequence

MNTSTVFRQV RVLDPFANTD MIADVWLNDG KIQAIDPHLN VISPETTIIE AQGLILGTGL 
VDLYSYSGEP GFEDRETLTS LAAAAIAGGF TRVAILPQTK PGVDNAATFS FLQQKAQTLP 
NSPHLHFWGN LTLGGQGKQM TELAELAMAG VVGFTDGQSI ENLGLLRRIL EYLKPLEKPV 
ALVPESSSLK GNGVMREGLL SIHYGLPGNP AIAESSAIAT ILEIVAEINT PVHLMGISTR 
RGVELMASAK ARGLPITAST SWMHLLLDTH DISNYDPSLR LEPPLGNPED RQALIEGVRE 
GIIDAIAVNH RSLTYEEKTV AFAEAPTGAI GLELALPLLW DQLVVQGEWS PLQLWKALSC 
YPCQCLGLEV AGLQVGQPAE LILFDPQKTW QVDGTTLQCL GRNTPWYQQE IKGRVITSFV 
GKENNTLT