Gene Ava_3352 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_3352
Symbol
ID	3680150
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	4172229
End bp	4173296
Gene Length	1068 bp
Protein Length	355 aa
Translation table	11
GC content	37%
IMG OID	637718702
Product	3-beta hydroxysteroid dehydrogenase/isomerase
Protein accession	YP_323854
Protein GI	75909558
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1088] dTDP-D-glucose 4,6-dehydratase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	23
Plasmid unclonability p-value	0.401631
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.133016
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTGAAC GTGTTTTAAT TTTAGGAGGG GCTGGTTTTA TTGGCAGTTC TTTAGCAATC 
AGTCTCAAAC AACAGCATCC TTCATGGAAA ATCAGTTGTT TTGATAATTT ACGGAGACGA 
GGTTCAGAAT TAAATCTGAC TAGATTCAAA AAATCAGGAA TTGAGTTTAT TCACGGTGAT 
ATTCGCTCTT CTAGCGATTT AGAACCCGGA ATGTTCAATA TCGATACTAT TATTGACTGT 
TCTGCTGAAC CTTCTGTTCT TGCAGGATTT TCCTCTCCAC AATACGTCCT GCAAACAAAT 
TTATTAGGAA CTATTAATGT TCTGGAACTA GCTAGACAAA TCGATGCTCG TTTGCTTTTT 
CTCTCTACTA GTCGTGTTTA TCCGATTGAA ACACTGAAGT CCATTAATCT GATAGAATCA 
CCAACCCGAT TGACTATTGC TCCTGAGCAA ACAATTTCCG GAGTATCTAA TCTTGGTATT 
GCCGAAGACT TTCCTCTTCA AAGCTACCGT TCTCTATATG GTACTACTAA ACTTGCATCA 
GAGATGCTAA TTGAAGAGTA TCGACAAGCT TACGGTATTC AAGCAATAGT TAATCGTTGT 
GGCGTAATTA CAGGGCCTTG GCAAATGGGT AAAGTTGACC AAGGTGTTTT TGTTTTATGG 
TTAGCTGCAC ACTATTTTGA GAAATCTTTA AGTTATATCG GCTACGGTGG TACAGGTAAA 
CAAGTGAGAG ATTTATTACA TATTGAAGAT TTATTAAGAC TAATTAGCTA CCAATTAGAA 
CATTTTTCGG AACTAGGTGG GGATGTATTA AATGTTGGTG GAGGTGCTGA TAATAGTCTA 
TCTCTATTAG AAACTACTAA GCTCTGTGAA GCAATTACGG GTAAGTCTAT TCCTATTAAA 
TCAGAAGTCA CAGCTAGACA GGGTGATATA CCCATTTACA TTACAGATTC TTCCAAAATT 
ATCTCTAAGA CTGGATGGAA ACCAACCATG AATCCAGAAC AAACTCTGCG AGATATTTAT 
AGTTGGATTC TTGAATATGA GGAATTTCTT CAGCCCATTT TATCCTAA

Protein sequence

MAERVLILGG AGFIGSSLAI SLKQQHPSWK ISCFDNLRRR GSELNLTRFK KSGIEFIHGD 
IRSSSDLEPG MFNIDTIIDC SAEPSVLAGF SSPQYVLQTN LLGTINVLEL ARQIDARLLF 
LSTSRVYPIE TLKSINLIES PTRLTIAPEQ TISGVSNLGI AEDFPLQSYR SLYGTTKLAS 
EMLIEEYRQA YGIQAIVNRC GVITGPWQMG KVDQGVFVLW LAAHYFEKSL SYIGYGGTGK 
QVRDLLHIED LLRLISYQLE HFSELGGDVL NVGGGADNSL SLLETTKLCE AITGKSIPIK 
SEVTARQGDI PIYITDSSKI ISKTGWKPTM NPEQTLRDIY SWILEYEEFL QPILS