Gene Ava_0120 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_0120
Symbol
ID	3683337
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	159489
End bp	160808
Gene Length	1320 bp
Protein Length	439 aa
Translation table	11
GC content	48%
IMG OID	637715447
Product	dihydroorotase
Protein accession	YP_320641
Protein GI	75906345
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	35
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCCTCTC CACAAAGTTT GCTAATTCGC GGCGCTCGCA TCCTTTTACC GAATGGTGAA 
TTTTTGCTGG GAGATGTGTT GATACGCGAT CGCCATATCA TTGAAGTAGG GACAGAAATA 
GTCAACACTA CACCAGCTAC AGAGATTGAC GCGAAAGGTT TGACTTTGTT GCCAGGAGTC 
ATAGACCCCC AGGTGCATTT CCGCGAACCG GGGCTAGAAC ATAAGGAAGA TTTGTTTACA 
GCCAGCTGCG CCTGTGCCAA AGGTGGGGTG ACTTCTTTTT TAGAAATGCC CAACACGCGC 
CCCCTGACAA CTAGCCAGCA AGCGTTAGAT GATAAGTTAC AACGGGCTGC TAGTAAGTGT 
TTGGTAAATT ATGGGTTTTT TATTGGGGCA ACTGGGGAGA ACACACCAGA ATTATTAGCC 
GCCAACCCAA CACCAGGCAT TAAGATTTTC ATGGGTTCAA TGCACGGTCA GTTGTTAGTT 
GATCAAGATG CTGTACTGGA GTCGATATTT GCTCAAGGTC AACGCCTCAT TGCTGTTCAT 
GCCGAAGACC AAGCCAGAAT TAACCAGCGC CGTCAAGAAT TTGCGGGGAT TCAAGACCCG 
GCAATTCACT CCCAAATTCA AGATAATCAA GCGGCACTGT TAGCAACACA GTTGGCATTA 
AAACTTTCTA AAAAATATCA GCGTCGGTTA CATATTCTGC ATATGTCCAC AGCCGACGAA 
GCTGAATTAC TACGCCAAGA CAAGCCTATT TGGGTAACAG CAGAGGTCAC ACCACAACAT 
TTAGTCTTGA ATACTGGTGA TTATGAGCGT ATTGGTACAT TAGCACAGAT GAATCCGCCC 
TTGCGATCGC CCCACGATAA CGAAGTTTTG TGGCAAGCGT TGCGGGATGG TGTGATTGAT 
TTTATCGCCA CAGACCACGC CCCCCACACC TTAGAAGAAA AAGCCCAACC CTATCCCAAC 
AGTCCTTCTG GGATGCCTGG GGTAGAAACA TCCTTGGCTG TGATGTTGAC GGCGGCGATG 
GAGGGGAAAT GTACCATTGC CCAAGTAGCC AACTGGATGT CCAAAGCTGT AGCTGTAGCT 
TATGGTATCC CCAATAAGGG AGCGATCGCT CCTGGTTACG ATGCTGATTT AGTACTTGTT 
GATTTGAATA CATACCGCCC CGTCCTCCGC GAAGAACTCT TAACTAAATG TCGCTGGAGT 
CCCTTTGAAG GCTGGAACCT CACGGGATGG GCCGACACAA CCATAGTTGG TGGTCAGATT 
GTCTACCACA AAGGCAAGTT AAACACCGAA GCGCGCGGTC AAGCTTTAAG TTTCGTGTAG

Protein sequence

MSSPQSLLIR GARILLPNGE FLLGDVLIRD RHIIEVGTEI VNTTPATEID AKGLTLLPGV 
IDPQVHFREP GLEHKEDLFT ASCACAKGGV TSFLEMPNTR PLTTSQQALD DKLQRAASKC 
LVNYGFFIGA TGENTPELLA ANPTPGIKIF MGSMHGQLLV DQDAVLESIF AQGQRLIAVH 
AEDQARINQR RQEFAGIQDP AIHSQIQDNQ AALLATQLAL KLSKKYQRRL HILHMSTADE 
AELLRQDKPI WVTAEVTPQH LVLNTGDYER IGTLAQMNPP LRSPHDNEVL WQALRDGVID 
FIATDHAPHT LEEKAQPYPN SPSGMPGVET SLAVMLTAAM EGKCTIAQVA NWMSKAVAVA 
YGIPNKGAIA PGYDADLVLV DLNTYRPVLR EELLTKCRWS PFEGWNLTGW ADTTIVGGQI 
VYHKGKLNTE ARGQALSFV