Gene Ava_4637 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4637
Symbol
ID	3680006
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	5799809
End bp	5801179
Gene Length	1371 bp
Protein Length	456 aa
Translation table	11
GC content	47%
IMG OID	637719992
Product	thioredoxin reductase
Protein accession	YP_325129
Protein GI	75910833
COG category	[O] Posttranslational modification, protein turnover, chaperones
COG ID	[COG0492] Thioredoxin reductase [COG3118] Thioredoxin domain-containing protein
TIGRFAM ID	[TIGR01292] thioredoxin-disulfide reductase

Plasmid Coverage information

Num covering plasmid clones	7
Plasmid unclonability p-value	0.0000231293
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.140967
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTCTAACC CAACTGTAGA AAACTTAGTC ATTATTGGTT CTGGGCCAGC AGGGTACACG 
GCTGCTATCT ATGCGGCGAG AGCTAACCTA AAACCCGTTG TATTTGAAGG TTTTCAAGCT 
GGGGGTTTGC CTGGTGGGCA ACTTATGACA ACGACTGAGG TAGAAAACTT TCCAGGGTTT 
CCCCAAGGGA TTACCGGGCC GGATTTAATG GATAGGATGA AGGCTCAAGC AGAACGCTGG 
GGGGCTGAGT TATATACTGA AGATGTTATA TCAGTTGACT TGAGCCAACG TCCATTTACT 
GTGCGCTCAG AGGAAAGAGA ATTTAAAGCA CACAGTATTA TTATTGCCAC TGGTGCGACG 
GCAAAACGTT TAGGTTTACC TAGCGAGCAT CAATTCTGGA GTCGGGGGAT TTCGGCTTGT 
GCAATTTGTG ATGGTGCAAC CCCAATTTTC CACGGTGCAG AGTTAGCTGT GATTGGTGCT 
GGTGACTCGG CGGCGGAAGA GTCCATATAT CTCACCAAGT ACGGCTCGAA GGTTAATTTG 
TTGGTGCGTT CTGAAAAGAT GCGGGCTTCT AAAGCTATGC AAGACCGCGT TTTGAGTAAC 
CCCAAAATCC AAGTGCATTG GAACACAGAA GTTGTGGATG TGTTTGGTAA TGGTCACATG 
GATGGGGTGA AAGTCCGCAA TAATAAGACT GGGGAAGAAA CCACAGTACA CGCCAGGGGT 
TTGTTCTACG CTATTGGTCA CAAGCCCAAC ACTTCCTTAT TTCAGGGACA ACTAGAACTA 
GATGAAATTG GTTATGTTGT TACCAAACAT GGTTCGCCAG AAACTAGTGT AGAGGGTGTG 
TTCGCGGCGG GTGACGTACA AGACCATGAG TATCGTCAAG CAATTACGGC GGCTGGTAGT 
GGCTGCGCGG CGGCGCTGTT AGCGGAACGT TGGTTGTCTG CGAATGCGTT GATTCAAGAG 
TTCCATCAAG AACCAACAAT CAATAATGAG TTAGAAACTC AGCCAGTAGC GCAGAAAACA 
GAAGCGGAAC AAGAGGCGGG ATTTGCTTTG AGCGCAACTC GCCATGCTGG TGGCTATGCT 
TTACGAAAAT TATTTCATGA AAGCGATCGC CTACTCATTG TCAAATACGT CTCCCCTGGC 
TGTGGCCCTT GCCATACTCT CAAGCCAATC TTAAATAAAG TAGTCGATGA ATTTGACGGC 
AAAATCCACT TTGTGGAAAT CGACATTGAC CAAGACCGGG ATATTGCGGA AAATGCTGGG 
GTAACCGGCA CACCAACTGT TCAGTTCTTT AAGGATAAAG AACTGGTGAA AGAAGTTAAG 
GGTGTTAAGC AAAAAAGTGA GTATCGTCAG TTGATTGAAG CTAATCTCTA G

Protein sequence

MSNPTVENLV IIGSGPAGYT AAIYAARANL KPVVFEGFQA GGLPGGQLMT TTEVENFPGF 
PQGITGPDLM DRMKAQAERW GAELYTEDVI SVDLSQRPFT VRSEEREFKA HSIIIATGAT 
AKRLGLPSEH QFWSRGISAC AICDGATPIF HGAELAVIGA GDSAAEESIY LTKYGSKVNL 
LVRSEKMRAS KAMQDRVLSN PKIQVHWNTE VVDVFGNGHM DGVKVRNNKT GEETTVHARG 
LFYAIGHKPN TSLFQGQLEL DEIGYVVTKH GSPETSVEGV FAAGDVQDHE YRQAITAAGS 
GCAAALLAER WLSANALIQE FHQEPTINNE LETQPVAQKT EAEQEAGFAL SATRHAGGYA 
LRKLFHESDR LLIVKYVSPG CGPCHTLKPI LNKVVDEFDG KIHFVEIDID QDRDIAENAG 
VTGTPTVQFF KDKELVKEVK GVKQKSEYRQ LIEANL