Gene Ava_5012 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_5012
Symbol
ID	3679025
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	6300326
End bp	6301435
Gene Length	1110 bp
Protein Length	369 aa
Translation table	11
GC content	39%
IMG OID	637720372
Product	ABC transporter, substrate-binding protein, aliphatic sulphonates
Protein accession	YP_325504
Protein GI	75911208
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID	[TIGR01728] ABC transporter, substrate-binding protein, aliphatic sulfonates family

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.0114898
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	10
Fosmid unclonability p-value	0.178041
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAGTCAAT TAATAAAAGA TTTTGCAAAT ATATCTCAAG CGTGGACAAG TAAACGCACT 
ACTCGTCGTC ACGCCTTATT TGCCTTTGGC TGTAGCCTAG TATTGTCTAC CACACTATTT 
AGTTGCAGTC CTTCACAAAA TAATAACCAG CAACAAGCAT CTTCTTCCGC ATCTAATGTA 
GCAAATACAA ATGCTACTAA TAAAGTGGTG AGGATTGTCC GTTCCAAACA ATTGACAGCT 
TTAGCGGTTC TAGAACAAAA ACGTATTCTA GAAGAGCGAC TAAAACCTTT AGGTTACAAA 
GTAGAATGGC CTGAATTTGC TGCTGGCCCT CAGCAATTAG AAGCTTTGAA TACAGGCGCA 
CTGGATATTG CTTCAACTGC TGAATCACCT CCTATCTTTT CCCAAGCAGC AGGGACACCT 
CTAGTTTATT TAGCTGCTAA TTCTTCTGAT GGTAAAGCAG TGTCGCTATT AGTTCCTGCT 
AACTCTAATG TTAAAAGTGT TAAAGACTTA AAAGGCAAGA AAATTGCTTC TCAAAAAGCA 
TCTATCGGTC ACTATCTTAT AGTCAGAGCT GTAGAAAGAG AAGGTTTAAA ACTGAGTGAT 
ATACAGCCAG TTTATCTACC ACCTCCGGAC GCAAATGTGG CATTTAGCCA AGGTAAAGTG 
GATGCTTGGT TTATTTGGGA ACCATTTGTG ACTAGAAATG TACAACAGAA GGTTGGCAGA 
GTTTTAACAG ATGGTGGTAA TGGTTTACGG GATACTAACA ACTATGTCTC TACAACCCGT 
AAGTTTTATC AAGAAAATCC AGAGTTAATC AAAATATTTC TGGAAGAACT GCAAAAAGCC 
CAAAATTGGG CAAAAAATAA CCCCAAAGAA CTGGCTAACT TACTTGCTCA AACTACTCAA 
CTTGACCCGC CTACATTAGA AATTATGCAC AGTAAGTATG ATTTCACACT CATACCAATT 
ACTGAACAAA TTATTAACAA ACAGCAGGAA GTTGCTGACA AATGGTACCG TTTAGGGCTG 
ATACCAAGAA AGGTGAATGT CAGAGATGGC TTTTTAACTC CAGAACAATA TGCGGAAATT 
ACTCCCCAGG AAGTGCTGGC AAAAAAATAG

Protein sequence

MSQLIKDFAN ISQAWTSKRT TRRHALFAFG CSLVLSTTLF SCSPSQNNNQ QQASSSASNV 
ANTNATNKVV RIVRSKQLTA LAVLEQKRIL EERLKPLGYK VEWPEFAAGP QQLEALNTGA 
LDIASTAESP PIFSQAAGTP LVYLAANSSD GKAVSLLVPA NSNVKSVKDL KGKKIASQKA 
SIGHYLIVRA VEREGLKLSD IQPVYLPPPD ANVAFSQGKV DAWFIWEPFV TRNVQQKVGR 
VLTDGGNGLR DTNNYVSTTR KFYQENPELI KIFLEELQKA QNWAKNNPKE LANLLAQTTQ 
LDPPTLEIMH SKYDFTLIPI TEQIINKQQE VADKWYRLGL IPRKVNVRDG FLTPEQYAEI 
TPQEVLAKK