Gene Ava_4055 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4055
Symbol
ID	3681676
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	-
Start bp	5040544
End bp	5041677
Gene Length	1134 bp
Protein Length	377 aa
Translation table	11
GC content	46%
IMG OID	637719406
Product	molybdate metabolism transcriptional regulator
Protein accession	YP_324554
Protein GI	75910258
COG category	[K] Transcription [P] Inorganic ion transport and metabolism
COG ID	[COG1476] Predicted transcriptional regulators [COG1910] Periplasmic molybdate-binding protein/domain
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	13
Plasmid unclonability p-value	0.00182658
Plasmid hitchhiking	Yes
Plasmid clonability	hitchhiker

Fosmid Coverage information

Num covering fosmid clones	11
Fosmid unclonability p-value	0.26319
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAAGCAGG ATAGTGGCCT CCTTAATAAC TTGAAAGCAA TCAGAACGCG CTTAGGGATG 
AGCCAGCAAG ATTTGGCTAA CATTGCTAGT GTAACTCGTC AGACCATTAG TGGTGTGGAA 
TCGGGACAAT ATGCCCCCTC AGTGGCGATC GCACTACGCA TAGCTAAAGC ACTTGGTTGT 
CAAGTTGAGG ATCTATTCTG GCTAGACCAA GACTTACCTA CAATTGAAGC AGTCCTCACA 
AAACCCATAC CCGCAGATCA GTCCATACGC CTGAGTTTAG CAAGGGTTGG CGGACAATGG 
GTCGCTTATC CCCTATTGGG TAAAGATGCC TTTCGCCAAG ATATGATTCC GGCAGATGGG 
GAAGGAGTGA GCCAAACAGG AAGCGGTAAA GTGCAAGTGA GGCTGTTAGA TGATAACTTA 
GCCGCACTGC ATAACACAGT AGTGATTGCA GGTTGCTCGC CTGTAATTGC ACTCTGGGCA 
AGAGCTACCG AACGCTGGCA TCCACAACTG CGAGTACATT TTACCTTTGC CAACAGCATA 
GATGCCCTGC AAAGTCTATG CAGAGGTGAA GCGCACATTG CTGGGATGCA CCTATATGAT 
CCCAAAACTG ACGAACATAA CGTGCCGTTT GCCCGTGAAA TCTTAGCAGG AAGGGAAGCT 
GTTTTAGTAA CTCTAGGTTT ATGGGAAGAA GGGCTGATAG TCCCATCGGG TAATCCCAAG 
GGTTTTAAAA CACTAAACGA TGTAGTAGAA GCACAAGCAA CCATCGTCAA TCGTGAAGTT 
GGTGCTGGTA GTCGAATGCT TTTAGAGCAA AAACTGCAAC AAGAACACAT ACCATTTGCA 
GCAGTCAAAG GATTTGAGCA GATTGCCACT AGCCATCAAG ATGTTGCCCA AGCCGTCGCA 
CTAGGGTTTG TGGATGCAGG TATTAGTACA GCATCCGTCG CTGCTACCTT TGGCTTAGGA 
TTTGTACCTC TGCATCAATC AAGATATGAT TTAGTGATTC TGAAGGAATA TTTAGAAGAA 
GCACCTATAC AACAATTGTT GAGTACCTTG GGACATCGCA TGGTTCACTC GCAACTAGAA 
GTCCTCGGTG GCTATGACAT TACAAAAATT GGGGAAGTTG TAGCAACGGT TTAG

Protein sequence

MKQDSGLLNN LKAIRTRLGM SQQDLANIAS VTRQTISGVE SGQYAPSVAI ALRIAKALGC 
QVEDLFWLDQ DLPTIEAVLT KPIPADQSIR LSLARVGGQW VAYPLLGKDA FRQDMIPADG 
EGVSQTGSGK VQVRLLDDNL AALHNTVVIA GCSPVIALWA RATERWHPQL RVHFTFANSI 
DALQSLCRGE AHIAGMHLYD PKTDEHNVPF AREILAGREA VLVTLGLWEE GLIVPSGNPK 
GFKTLNDVVE AQATIVNREV GAGSRMLLEQ KLQQEHIPFA AVKGFEQIAT SHQDVAQAVA 
LGFVDAGIST ASVAATFGLG FVPLHQSRYD LVILKEYLEE APIQQLLSTL GHRMVHSQLE 
VLGGYDITKI GEVVATV