Gene PCC8801_4419 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_4419
Symbol
ID	7104864
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	4647155
End bp	4648468
Gene Length	1314 bp
Protein Length	437 aa
Translation table	11
GC content	43%
IMG OID	643477398
Product	dihydroorotase
Protein accession	YP_002374497
Protein GI	218249126
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGACACAAC TCCTCATTCG TCACGGTCAG ATTCTTTTGC CAGATGGCCA GTTGCTTCTA 
GGAGATGTTC TATGTGAAAA TGGAACTATC CGAGAAATCG CTCCAGAAAT TTCTGTAAAA 
GATCTTAACA CTATCATAGA CGCTAGGGGA TTAACTTTGT TGCCTGGAGT CATTGATCCC 
CAGGTACATT TCCGCGAACC GGGATTAGAA CACAAGGAAG ACTTATTTAC CGCTACCCGC 
GCTTGTGCCA GAGGGGGGGT AACATCCTTC TTGGAAATGC CCAATACTAA CCCATTAACG 
ATTACCCAAG CTACGTTAGA AGATAAATTA CAACGGGCTG CCCAAAAGTG TCTCGTTAAT 
TATGGCTTTT TTATTGGGGC AACTCCCGAC AATTTACCGG ATTTATTGAC TGCTAACCCT 
ACCTGTGGCA TTAAAATCTT TATGGGGTCG TCCCATGGGG CTTTATTGGT GAGTCGGGAA 
GGGGAGTTAG AACCCATTTT TGCCAAAGGA AGTCGTTTAA TTGCAGTTCA TGCCGAAGAT 
CAAGCGAGAA TACTGGAACG TCGTCGGGAA TTTGCCGGAA TTAGCGATCC AGCAGTGCAT 
TCCCAGATTC AGGATGAAGA AGCTGCCCTC AACGCGACGA AATTAGCCTT AAAACTGTCG 
AATAAGTATC AAAGGCGGTT ACACATTCTA CACCTTTCGA CGGGGATAGA AGCGGAATTT 
TTGCGAGAAA ATAAGCCCAG TTGGGTAACA GCAGAAGTCA CGCCTCAACA TTTGTTATTA 
AATACCGATG CTTATGAGAA AATTGGCACG TTAGCCCAGA TGAATCCTCC CTTGCGATCG 
CCTGAAAATA ATGATATTCT TTGGCAAGCT TTGCTTGATG GGGTGATTGA TTTTATTGCG 
ACAGATCACG CGCCCCATAC TTTGGAAGAA AAGGCAAAAC CCTATCCTAA TTCGCCTTCG 
GGAATGCCAG GGGTAGAGAC TTCTTTACCC TTAATGTTAA CCCAAGCAAT CAAGGGAAAA 
TGTAGTGTTG CCCAAGTGGT TAATTGGATG TCTACCGCAG TGGCTAAAGC CTATAAAATC 
CCGAATAAGG GATTAATTGA ACCTGGATAT GATGCTGATT TAGTCTTAGT TGATTTAGAT 
AATTATTATC CCGTTAAACG AGAAGACTTA CAAACTAAAT GCGGTTGGAG TCCTTTCGAG 
GGTTGGGAAT TAACAGGATG GCCGATAGTA ACTATTGTCG GTGGAAAAGT CGTTTATGAT 
CGGGGTCAAT TCAATACAGA TATTAGGGGC AAAGCATTAA CTTTTAGTAG TTAA

Protein sequence

MTQLLIRHGQ ILLPDGQLLL GDVLCENGTI REIAPEISVK DLNTIIDARG LTLLPGVIDP 
QVHFREPGLE HKEDLFTATR ACARGGVTSF LEMPNTNPLT ITQATLEDKL QRAAQKCLVN 
YGFFIGATPD NLPDLLTANP TCGIKIFMGS SHGALLVSRE GELEPIFAKG SRLIAVHAED 
QARILERRRE FAGISDPAVH SQIQDEEAAL NATKLALKLS NKYQRRLHIL HLSTGIEAEF 
LRENKPSWVT AEVTPQHLLL NTDAYEKIGT LAQMNPPLRS PENNDILWQA LLDGVIDFIA 
TDHAPHTLEE KAKPYPNSPS GMPGVETSLP LMLTQAIKGK CSVAQVVNWM STAVAKAYKI 
PNKGLIEPGY DADLVLVDLD NYYPVKREDL QTKCGWSPFE GWELTGWPIV TIVGGKVVYD 
RGQFNTDIRG KALTFSS