Gene NATL1_06241 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	NATL1_06241
Symbol
ID	4779514
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Prochlorococcus marinus str. NATL1A
Kingdom	Bacteria
Replicon accession	NC_008819
Strand	+
Start bp	568193
End bp	569257
Gene Length	1065 bp
Protein Length	354 aa
Translation table	11
GC content	37%
IMG OID	640083901
Product	dihydroorotase
Protein accession	YP_001014451
Protein GI	124025335
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0418] Dihydroorotase
TIGRFAM ID	[TIGR00856] dihydroorotase, homodimeric type

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.104893
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	18
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGATTGCTT CTGTTAATCA AATCTCATTA TTAAAGCCGG ATGATTGGCA TCTGCATTTG 
AGAGATGGAA AGATTCTTAA AGGTGTTTTA AGTCATACAG CAGATGTGTT TTGCCGTGCA 
ATCATCATGC CTAATCTTGA TCCGCCAATA ACTACTTTAA GCCAAGCACA AGAGTATAAA 
AAAAGAATTA TCCAGTCTAT CCCTGAAGGT GTTTCTTTTA CCCCATTAAT GACAGCATAT 
CTTACAGATG ATATGCCTGC GAATGTTTTA GAGAGAGGCT TTAGAGAAGG TGTCTTTCAT 
GGGGCAAAGC TCTATCCAGC TAATGTGACA ACTAATTCTT CTTATGGGGT TACAGATATA 
AGTAAAGTCG GCAATTTATT TGAGACGATG GAAAGAATTG GTATGCCATT ATTGATTCAT 
GGAGAAGTGA CCGATTTCAA TGTTGATGTA TTTGATAGAG AAGCTGTTTT TATTGAGCGT 
CACCTTGAAC CACTATTACG AACATTTTCA TCACTTAAAG TGGTTTTAGA ACACATCACG 
ACCATAGATG CAATTGACTT TGTAGAAAAC AGTGAGTTTG ATATAGCCGC TACAATCACA 
CCTCATCATC TACATATCAA TCGAAACGCA ATGTTCAATG GTGGTTTAAG GAGTGATTTT 
TATTGCTTAC CCACAGCTAA ACGTGAAATC CATCGTATTG CTCTAAGACA AGCGGCTACT 
AGCGGTAAAA CTTGCTTTTT CCTTGGAACT GATTCAGCAC CTCATACCCG TAGATTTAAG 
GAAAGTTCAT GTGGATGTGC AGGAATCTTT AATGCCCCTT TCGCTTTGGA AAGCTATTTA 
AAAGTTTTCG AAGAAGAAAA TGCCCTAGAT AGGTTTGAAG CTTTTTCAAG TATTAATGGA 
GCAACTTTTT ATGGATTACC TTTAAACACA GAGAGAATAA CTTTAATTAG AAAAGATATT 
TCCGTACCTC AAATGATTGA TGTTGGATTA GATGGTAATC CCAATGATTT TGTAAAACCA 
TTTCATTCAG GAGAAACTCT TAGCTGGGCA ATAAAGGATG TTTAG

Protein sequence

MIASVNQISL LKPDDWHLHL RDGKILKGVL SHTADVFCRA IIMPNLDPPI TTLSQAQEYK 
KRIIQSIPEG VSFTPLMTAY LTDDMPANVL ERGFREGVFH GAKLYPANVT TNSSYGVTDI 
SKVGNLFETM ERIGMPLLIH GEVTDFNVDV FDREAVFIER HLEPLLRTFS SLKVVLEHIT 
TIDAIDFVEN SEFDIAATIT PHHLHINRNA MFNGGLRSDF YCLPTAKREI HRIALRQAAT 
SGKTCFFLGT DSAPHTRRFK ESSCGCAGIF NAPFALESYL KVFEEENALD RFEAFSSING 
ATFYGLPLNT ERITLIRKDI SVPQMIDVGL DGNPNDFVKP FHSGETLSWA IKDV