Gene Ava_4795 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4795
Symbol
ID	3679410
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	6025646
End bp	6027085
Gene Length	1440 bp
Protein Length	479 aa
Translation table	11
GC content	48%
IMG OID	637720152
Product	zeta-carotene desaturase / three-step phytoene desaturase
Protein accession	YP_325287
Protein GI	75910991
COG category	[S] Function unknown
COG ID	[COG3349] Uncharacterized conserved protein
TIGRFAM ID	[TIGR02731] phytoene desaturase

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.000234203
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	19
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGAGTAG CGATCGCTGG CGCTGGTCTA GCAGGACTTT CCTGCGCGAA ATATCTCACG 
GACGCAGGTC ACACTCCCAT AGTCTTAGAG CGTCGGGACG TATTGGGTGG CCTTGTGGCG 
GCGTGGAAAG ACTCTGACGG CGACTGGTAC GAAACCGGGT TACACGCCTT CTTTGGGGCA 
TATCCCAATA TGCTGCAATT ACTGAAGGAG TTGGGCATTG AAGACCGACT CCAGTGGAAA 
GAACATACAC TGATTTTTAA TCAACCAGAT AAACCCGGAA CACTCTCACG TTTTGATGTT 
CCTGATATCC CCTCTCCCTT TAACATCATT GCCTCGATCC TTCGCAACAA CGATATGTTG 
ACTTGGGAAC AGAAGATTAG GTTCGCTATT GGACTGCTTC CAGCAATAGT TCGAGGCCAG 
AAGTATGTTG AGGAGATGGA CAAGTACAGC TTCTCCGATT GGTTGAAAAG GCAAGGTGTG 
GGTGAGCGGG TAGCAAGTGA CGTGTTCATC GCCGCATCCA AGGCTTTAAC CTTTATTAAT 
CCCGATGAGG TTTCCTCGAC AATTCTATTA ACAGCCCTAA ATCGCTTTCT GCAAGAGCGA 
TATGGCTCCA AAATAGCCTT TTTGGATGGT TCTCCCACAG AACGACTGTG CCAACCAATC 
GTTGATTACA TCACCGAACG AGGTGGAGAA GTCAGGCTCA ACGCCCCTCT AAAAGAGATT 
TTGCTCAACC CGGATGGTAC AGTAAAAGGG TTCTTGCTGC GCGGGTTAAA TGGAGAACCA 
GATGAAATGA TTACGGCAGA CTTTTACGTG TCAGCTATGG CAGTTGACCC ATTAAAAGTC 
ATGTTGCCAC AACCTTGGCA GCAAATGGAG TTTTTCCAGA AGCTAGAAGG TTTAGAAGGC 
GTACCAGTAA TTAACCTCCA TCTGTGGTTT GATCGGAAAT TAACAGACAT TGATCACCTG 
TTGTTTTCGC GATCGCCCCT CCTCAGCGTT TATGCTGATA TGAGTAACAC TTGTCGTGAA 
TATGCTAATC CTGACCGCTC AATGCTGGAA TTAGTTCTAG CTCCCGCCAA AGACTGGATT 
AGTAAATCCG ACGAGGAAAT CGTCTCTGCT ACTATGGTCG AATTGGAAAA ACTCTTCCCC 
GACCACTTTA AGGGCGATAA TCCAGCAAAA TTGCTGAAAT CTCACGTCGT AAAAACGCCG 
CGTTCAGTTT ACAAAGCGAC TCCTGGTCGT CAACAGTACC GTCCAGCCCA AAAAACCCCC 
ATTGCCAATT TCTTTCTAAG TGGGAGTTAC ACCATGCAAC GCTATTTAGG CAGTATGGAA 
GGGGCCGTAC TTTCTGGTAA GCTAACAGCG CAGGCGATTT GTGAATCGCT GCCAGAGGAC 
AACACCTCAA ACCTGCAAAC GCTAACCCGA CCGCCTGCAA CGAATGCTGC AACTGCCTGA

Protein sequence

MRVAIAGAGL AGLSCAKYLT DAGHTPIVLE RRDVLGGLVA AWKDSDGDWY ETGLHAFFGA 
YPNMLQLLKE LGIEDRLQWK EHTLIFNQPD KPGTLSRFDV PDIPSPFNII ASILRNNDML 
TWEQKIRFAI GLLPAIVRGQ KYVEEMDKYS FSDWLKRQGV GERVASDVFI AASKALTFIN 
PDEVSSTILL TALNRFLQER YGSKIAFLDG SPTERLCQPI VDYITERGGE VRLNAPLKEI 
LLNPDGTVKG FLLRGLNGEP DEMITADFYV SAMAVDPLKV MLPQPWQQME FFQKLEGLEG 
VPVINLHLWF DRKLTDIDHL LFSRSPLLSV YADMSNTCRE YANPDRSMLE LVLAPAKDWI 
SKSDEEIVSA TMVELEKLFP DHFKGDNPAK LLKSHVVKTP RSVYKATPGR QQYRPAQKTP 
IANFFLSGSY TMQRYLGSME GAVLSGKLTA QAICESLPED NTSNLQTLTR PPATNAATA