Gene Ava_2171 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Ava_2171
Symbol
ID	3679884
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Anabaena variabilis ATCC 29413
Kingdom	Bacteria
Replicon accession	NC_007413
Strand	+
Start bp	2686212
End bp	2687243
Gene Length	1032 bp
Protein Length	343 aa
Translation table	11
GC content	47%
IMG OID	637717514
Product	periplasmic binding protein/LacI transcriptional regulator
Protein accession	YP_322686
Protein GI	75908390
COG category	[G] Carbohydrate transport and metabolism
COG ID	[COG1879] ABC-type sugar transport system, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	27
Plasmid unclonability p-value	0.982265
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	0.26381
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGATGTGA AAAAACAGGC GATGTCTAAA GACAAGCTGC TACGCGTCTA CGCAGCAACT 
TTATTAAGTA TTGTCAGTGG TACTCTTGTC AGCTGCACAA ACATTTCTCC CAATGGCCCA 
ACGGCTGCTG ACACTGATAC CAATACCCAG ACCAACAATG GATCTCCCCA TAAATTGCGA 
TCGGTTGGTG TTACCCTGGG GGATTTGAGT AACCCTTTCT TCGTTGTCAT GGCCCAGGGA 
GCCGAGAAAG AAGCCAAGAA AATCGGTGGT GAGGATGTCA GAGTAACTGT AGTTTCTAGC 
GGCTATGACC TGAACCAGCA ATTCAACCAA ATTGAGAATT TCGTTGCGGC TAATACTGAC 
CTGATTATCA TCAATGCTGC TGACAGTAAA GGAATCAGAC CAGCCGTTGA CCAAGCAAGG 
CAAGCAGGTA AGGTTGTAAT TGCAGTAGAT ACGGCAATAG AAGCAGACAT AGACGCTACC 
GTCACCACCA ATAATGTGCA AGCGGGAGAA ATCAGTTGCC AATATATAGC CGATCGCCTC 
AAAGGCAAAG GTAATGTAGT CATAGTCAAC GGGCCGCCAG TAACATCGGT AATTCAGCGA 
GTGGACGGCT GCTTGAAAGT ATTAGCCAAA TATCCCGATA TCAAACTACT TTCTAAAGAC 
CAGAATGCAG AAGGTAGCAG AGATGGCGGA CTCAGGGTAA TGAGTGATTT GTTAGTCACA 
TTCCCCAAGA TTGATGCTGT CTTTGCCATC AACGATCCTA GCGGTGTGGG AGTAGACCTA 
GCCGCCAACC AAGCCAAACG CCAAGACTTT TTCATTGTGG GAGTTGACGG TGCGCCAGAA 
GCCATAGAAG CGATCGCCTC TGGAGATAGT TTATATGCAG CAACGGCAAC GCAAAACCCC 
AGAGGAATGA CGCAAACAGC CATTCAGGTA GGCAACGACA TTTTACATGG CAAAAAACCT 
GAATCACCCA ATATTTTGAT TCCTGCCAAG TTGATTACGA AAGAGAACGT GAGTACATCT 
ACAGGCTGGT AG

Protein sequence

MDVKKQAMSK DKLLRVYAAT LLSIVSGTLV SCTNISPNGP TAADTDTNTQ TNNGSPHKLR 
SVGVTLGDLS NPFFVVMAQG AEKEAKKIGG EDVRVTVVSS GYDLNQQFNQ IENFVAANTD 
LIIINAADSK GIRPAVDQAR QAGKVVIAVD TAIEADIDAT VTTNNVQAGE ISCQYIADRL 
KGKGNVVIVN GPPVTSVIQR VDGCLKVLAK YPDIKLLSKD QNAEGSRDGG LRVMSDLLVT 
FPKIDAVFAI NDPSGVGVDL AANQAKRQDF FIVGVDGAPE AIEAIASGDS LYAATATQNP 
RGMTQTAIQV GNDILHGKKP ESPNILIPAK LITKENVSTS TGW