Gene Ava_4148 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_4148
Symbol
ID	3681087
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	5174066
End bp	5175046
Gene Length	981 bp
Protein Length	326 aa
Translation table	11
GC content	36%
IMG OID	637719494
Product	ABC-type nitrate/sulfonate/bicarbonate transport systems periplasmic components-like
Protein accession	YP_324642
Protein GI	75910346
COG category	[P] Inorganic ion transport and metabolism
COG ID	[COG0715] ABC-type nitrate/sulfonate/bicarbonate transport systems, periplasmic components
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.193725
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.38818
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGTTCAAAC TACTGAGATA TATAAAAATT TTTCTCATTA CCGGGTGTTT GCTATTTGCT 
TGTCATGCTT CAACACCGAC TGAATTCAAA CGCCCTTCCT TGAAAGTACT ATTTGGATCT 
TTTGTTGGGG AGTATCCAGG TATTATTGCT CAAGAAAAAG GATTCTTCAA AGCCCAAGGG 
GTAGACGTAG AACTAATTCA TAAACGATAT ATCCAATTGG AACAAGCCAA TTTCAGTGCA 
GGTAAGTATG ATGGGATGAC ATCTTCTTTA GGAAATCTTA TTATCTTGAG TGCAATAAAT 
CTAGATATAC AAGGTGTGAT TGTTATAGAT GAATCGACAG GTGCAGATGT AGTAGTCGCC 
CAACCACAAA TTAAAACCGT TGCTGACTTG AAAGGGAAAA AGCTGGGTGC AAATCTAGGC 
GGTTTTAGTG AATTGTTCAT CACCGAGATG TTGAAAACTA ACAACTTAAA CAGTAATGAT 
GTGAATTTGG TTAGATTAGA GGCATTAAAA ATTCCTCAAA ACTTGAAAAA AAATTTTATT 
CAAGCCGGAC ACACTTGGGA ACCCTATCTT TCCGAAGCTA TGAAAATAGG AGGAAATATC 
TTATTTACTA GCAAACAAAC CCCTGGCTTG ATTTTAGATT TGATGATCTT TCGCGGTGAT 
GTAATCCGCG ATCGCCCTGG AGACATTCGT GCATTTGTGC AGGGATGGTT GCAAGCTTCG 
GAATATTGGA AAGAAAATGT TCAAGAAGGA AACACTATCA TCAGCAAAGC TTTAAAAATT 
CCTAGCAATA CAATTTCTCT AGAGGGAATA AGTCTGACTA GTTTAGATGA AAATCAAAAT 
TTATTTCAAT TTAGTAACCC TAACTCCATC GACAAAATAG CCAAAGTATA TGCAGATTTT 
TTTATTCGTG CTGGAAATTT GACGCGAATT CCTGAGCTAA AAAGTTTATT TAATTCTTCC 
TTCTTGAACC CTGCTTCCTA G

Protein sequence

MFKLLRYIKI FLITGCLLFA CHASTPTEFK RPSLKVLFGS FVGEYPGIIA QEKGFFKAQG 
VDVELIHKRY IQLEQANFSA GKYDGMTSSL GNLIILSAIN LDIQGVIVID ESTGADVVVA 
QPQIKTVADL KGKKLGANLG GFSELFITEM LKTNNLNSND VNLVRLEALK IPQNLKKNFI 
QAGHTWEPYL SEAMKIGGNI LFTSKQTPGL ILDLMIFRGD VIRDRPGDIR AFVQGWLQAS 
EYWKENVQEG NTIISKALKI PSNTISLEGI SLTSLDENQN LFQFSNPNSI DKIAKVYADF 
FIRAGNLTRI PELKSLFNSS FLNPAS