Gene Ava_3650 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3650
Symbol
ID	3679245
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	4554961
End bp	4556268
Gene Length	1308 bp
Protein Length	435 aa
Translation table	11
GC content	48%
IMG OID	637719001
Product	dihydroorotase
Protein accession	YP_324151
Protein GI	75909855
COG category	[F] Nucleotide transport and metabolism
COG ID	[COG0044] Dihydroorotase and related cyclic amidohydrolases
TIGRFAM ID	[TIGR00857] dihydroorotase, multifunctional complex type

Plasmid Coverage information

Num covering plasmid clones	22
Plasmid unclonability p-value	0.311057
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACAACTG AACTTCTGCA ACAAGTAAGG GTAATCGACC CGGTTTCGGG TATTGACAAT 
ATCACAGATG TGTTAATTGC TGATGGTGTA ATTCAAGCCA TTGCCCCAAA TATTCCTAAT 
ACTAGTCCTG ATACTCAAAT TAGAGATTGT CGAGGATTAG TTCTTGGCCC CGGTTTAGTG 
GATTTATACA GCCACTCTGG AGAACCAGGA TTTGAAGAAC GGGAAACGCT GGCATCTTTC 
TTACAAGCGG CGGCGGCTGG TGGTTTTACC AAAGTCAGTA TTTTACCCGA TACATCTCCG 
GCTATTGATA ATCCAGGGCT GGTGGCACAG TTGCAGAAGC GGGGACTGGG GATAGGAGAT 
TGGGGACTGG GAAGCAATTC TTCTCCCCTG CACCCCTGCA CCCCTGCACC CCTGCTCCAT 
CTTTGGGGTG CTATTACCCT GGATGTGGCT GGGAAGCAGA TGACAGAATT GGCTGATTTA 
GCGGCGGCGG GGGTGGTTGG TTTTACTGAT GGGTTGCCTT TAGACAATTT AAGCCTGGTG 
CGGCGCTTGC TGGAATATGT CCAACCATTG GGGAAACCTG TAGCATTTTG GCCGTGCGAT 
CGCCAACTCT CTGCTAATGG GGTGATGCGG GAAGGCGCAG ATGCCCTCCG CTTTGGTTTA 
CCTCCCATAC CCCCCAGCGC AGAAACAACA GCGATCGCTG CTTTATTAGA GTTGGTTGCC 
GCTACAGGTA ATACTCAAGT ACACATTATG CGGGTTTCCA CCGCCCGTAG TGTGGAACTA 
ATCGCCGCCG CCAAAGCCAA AGGTTTACCC ATCACCGCCA GTACCACTTG GCTACACCTG 
TTACTAGACA CAAAAGCAGT TAAAAGTTAT GATACCAGCC TGCATTTAGA CCCACCATTA 
GGTAACGCCA GCGATGTCAA AGCATTACGT GCAGGAGTCC GCACAGGGGT AATAGATGCG 
ATCGCCATTG ATCATGCGCC ATACACCTAC GAGGAGAAAG TCCAAGCCTT CGCCGAAGCA 
CCACCAGGGG CGATCGGTTT CGAGTTAGCA TTACCCTTAC TTTGGCAAAA TCTTGTAGAA 
ACTGGAGAAT TTACGGCTTT AGAATTATGG CAGGCTTTGA GTACTCGTCC AGCCCAATGT 
ATTCAACAAA AAGTGAGTGC ATTTGCCCCT CATCACAAAG CAGAACTAAC TTTATTTGAT 
CCTCAGAAAA TCTGGAAAGT CGAGAAGAAA AATCTGTGTA CACTTTCTAG TAACACATCT 
TGGTTAGGGC AAGAATTACA AGGTCGAGTC ATCCAAATTT GGCTCTAA

Protein sequence

MTTELLQQVR VIDPVSGIDN ITDVLIADGV IQAIAPNIPN TSPDTQIRDC RGLVLGPGLV 
DLYSHSGEPG FEERETLASF LQAAAAGGFT KVSILPDTSP AIDNPGLVAQ LQKRGLGIGD 
WGLGSNSSPL HPCTPAPLLH LWGAITLDVA GKQMTELADL AAAGVVGFTD GLPLDNLSLV 
RRLLEYVQPL GKPVAFWPCD RQLSANGVMR EGADALRFGL PPIPPSAETT AIAALLELVA 
ATGNTQVHIM RVSTARSVEL IAAAKAKGLP ITASTTWLHL LLDTKAVKSY DTSLHLDPPL 
GNASDVKALR AGVRTGVIDA IAIDHAPYTY EEKVQAFAEA PPGAIGFELA LPLLWQNLVE 
TGEFTALELW QALSTRPAQC IQQKVSAFAP HHKAELTLFD PQKIWKVEKK NLCTLSSNTS 
WLGQELQGRV IQIWL