Gene Tery_2179 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Tery_2179
Symbol
ID	4242631
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Trichodesmium erythraeum IMS101
Kingdom	Bacteria
Replicon accession	NC_008312
Strand	-
Start bp	3402944
End bp	3404242
Gene Length	1299 bp
Protein Length	432 aa
Translation table	11
GC content	39%
IMG OID	638107283
Product	dihydroorotase
Protein accession	YP_721883
Protein GI	113475822
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	14
Plasmid unclonability p-value	0.805984
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.355095
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATAGCA AATTACTTCA AAAAGTCCGA ATATTAGACC CTGTTTACGA CACAGACAGA 
GTTGCTGATG TTTTAATTAT TGATGGAAAA ATAGCCACAG TTGAGGAAAA TATTTCCGAG 
TTTCCAACTA AAACAGATAT TCAAGACTGT CAGGGATTAA TTTTAGGTCC TGGTTTAGTA 
GATTTATATT GTCATAGCGG AGAACCTGGG TTTGAGGAAC GGGAAACTAT AGAATCTCTA 
ATGCAAGCTT CTAAGGCAGG TGGTTTTACC AGGTTAGCAA TTTTGCCGGA TACTTTTCCT 
CCTGTGGATA ATTTGTCTGG TTTGGCAAGA TTACAAAATT TGGCAACTCA GGTAAATAAT 
AATTCTACTT TTCCTCTCTT TTATTATTGG GGTGCTATTA CTCAGGGTGT AAAAGGTAAG 
GAAATGACTG AGTTGGGGGA ATTAGCTGCA TCAGGTGTTA TAGGGTTTGC TGATGGTTTG 
GCTCTAGAAA ATCTTGGTTT GTTACGACGA GTTTTGGAAT ATTTGAAACC TCTGAATAAA 
TCTGTTGCTT TATTTTGCAA AAATTCTGGG TTAGCAGGTA ATGGGGTGAT GCGAGAGGGG 
TATGATTCTA TTCGTTTGGG TTTGCCTGGG GTTTCGACTA TGGCTGAAAC TTCTGCTTTG 
GCTGCTGTTT TAGAGTTAGT AGATGCTATT GGTACTCCGG TTCATATTAT GCGGGTCTCT 
ACTGCTCGGA GTGTAGAGTT AATTGCAAAT GCTAAAAGTA GGGGTTTGCC TATTACTGCT 
AGTACGACTT GGATGCATTT GTTGTTGGAT AGTCTGGCTA TTGAGGGTAA GTCTCTTCTG 
GATAATTATT TTTTTCCTTA TGACCCGAAT TTACGTTTGG AACCTCCTCT AGGAAGTCAG 
AGCGATCGCT TAACTTTACT TGAAGGTATT AGGGATGGGG TTTTAGATGC TATTGCTATT 
GACCATGCTC CTTATACTTA TGAAGAGAAA ACTGTTGCTT TTTCTGAAGC ACCCACAGGA 
GCAATAGGAC TACAAATAGC ATTACCTTTA TTATGGCAGA GTTTTGTCAA CACAGGACAG 
ATGTCGGCTT TAGAGTTATG GAGATTATTA AGTACGTCTC CTAGCAAATG TTTAGGATTA 
ATTCCTGGAG ATATCAGACC CCAAAAGTCA GCAGAAGTGA CTTTATTTGC TCCTCAAGAA 
ACTTGGGTAG TAGAAAAACA AACTTTGAAA TCTCGTTCTT TTAATACACC TTGGTTAGGA 
AAACAAATTC AAGGTCGTGT CCTAGAGTGG GAGTTTTAA

Protein sequence

MNSKLLQKVR ILDPVYDTDR VADVLIIDGK IATVEENISE FPTKTDIQDC QGLILGPGLV 
DLYCHSGEPG FEERETIESL MQASKAGGFT RLAILPDTFP PVDNLSGLAR LQNLATQVNN 
NSTFPLFYYW GAITQGVKGK EMTELGELAA SGVIGFADGL ALENLGLLRR VLEYLKPLNK 
SVALFCKNSG LAGNGVMREG YDSIRLGLPG VSTMAETSAL AAVLELVDAI GTPVHIMRVS 
TARSVELIAN AKSRGLPITA STTWMHLLLD SLAIEGKSLL DNYFFPYDPN LRLEPPLGSQ 
SDRLTLLEGI RDGVLDAIAI DHAPYTYEEK TVAFSEAPTG AIGLQIALPL LWQSFVNTGQ 
MSALELWRLL STSPSKCLGL IPGDIRPQKS AEVTLFAPQE TWVVEKQTLK SRSFNTPWLG 
KQIQGRVLEW EF