Gene PCC8801_3206 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_3206
Symbol
ID	7105894
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	3346316
End bp	3347638
Gene Length	1323 bp
Protein Length	440 aa
Translation table	11
GC content	48%
IMG OID	643476228
Product	Extracellular ligand-binding receptor
Protein accession	YP_002373339
Protein GI	218247968
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAACT TTTTCCCAAA ATTTCCTTTA AAATCTCCCC TAGCGTTAGC GTTAGCCATG 
ACTTTTAGTA CCAGTTTATT GGCCGGTTGT GGTGGAGGAC AACAAGAAGC CAGTAATACC 
CCTTCCCCCG ATGGGAGTCC CACAGCCGAA GGAGAAGGCT TAAAACTCGG TTCATTACTC 
CCAATAACCG GAGATTTATC CTCTATTGGG CAGAATATGC CCGTAGCTGT TAAATTTGCT 
GTTGATGAAA TTAACGCTTG TCAGGGGGTC AACGGCAAAC CTGTTACCCT GATTACCGAA 
GATGACCAAA CTGATCCGAC CGCAGGGGCT TCGGCCATGA CCAAATTGGC AGAAGTCGAT 
AAAGTAGCCG GGGTTGTGGG GGCTTTTGCT AGTAGCGTTT CCAGTGCTGC TGTCCCCATT 
GCGGTGAAAA ATAAAGTGAT GATGATTTCT CCAGGGAGTA CCAGTCCTAT CTTTACAGAA 
CAGGCTAAAG CGGGAGAATT TCAAGGGTTT TGGGCTAGAA CGGCTCCCCC TGATACCTAT 
CAGGCTCAAG CGTTGGCAGC CTTAGCCACT AAAAAAGGCT TTAAGAACGT AGGAACCGTG 
GTCATTAATA ATGACTATGG GGTGGGTTTT GAACAACAAT TTGTCAGCGC GTTTGAAAAA 
GCGGGGGGCA AAATCACTGA TAAGGAGAAG CCTGTGCGCT ATGATCCTAA AGCGGCAACC 
CTCGATAGTG AAGCCGCGGC CGCTTTTGCA GGTAAACCCA ATGCCGTAGC CGCCGTACTC 
TACGCTGAGA CGGGAAGCCT TTTGCTACAA GCTGCCTATA AGCAAGGGTT AACCGAAGGA 
GTGACGGTTC TGTTGACCGA TGGGGTGTAT TCAGAAGATT TTGTTAAACA GGTGGGACAG 
ACTCCCGATG GGAAGTCTAT TTTAACTGGG GCTTTAGGAA CGGTTCCTGG GGCTAATGGC 
CAAGCTTTAG AAGCATTTAC GACCAAATGG AAGGAAAAAA CGGGTAAGGA GATTACAGCG 
TTTGTTCCCC ATAGTTGGGA TGCAACTATC CTCTTAATGT TAGCAGCCGA AGCTGCTAAG 
GCCAATACAG GAGAGGCCAT TCAAAGTAAA CTCCGAGAAG TGGCTAATGC GCCGGGAACG 
GAGGTAACTG ACCCCTGTGA AGCAATGGAG TTAGTCCGTA AGGGAGAAGA TATTAACTAT 
CAAGGGGCTA GTGGTAACGT GGATATTGAT GAAAATGGGG ATGTTGTAGG TAGTTATGAT 
GTTTGGACAG TCAAAGAAGA TGGCAAGACC GAAGTGATTG ATAAAGTCAG TCCGGCTCAA 
TAA

Protein sequence

MSNFFPKFPL KSPLALALAM TFSTSLLAGC GGGQQEASNT PSPDGSPTAE GEGLKLGSLL 
PITGDLSSIG QNMPVAVKFA VDEINACQGV NGKPVTLITE DDQTDPTAGA SAMTKLAEVD 
KVAGVVGAFA SSVSSAAVPI AVKNKVMMIS PGSTSPIFTE QAKAGEFQGF WARTAPPDTY 
QAQALAALAT KKGFKNVGTV VINNDYGVGF EQQFVSAFEK AGGKITDKEK PVRYDPKAAT 
LDSEAAAAFA GKPNAVAAVL YAETGSLLLQ AAYKQGLTEG VTVLLTDGVY SEDFVKQVGQ 
TPDGKSILTG ALGTVPGANG QALEAFTTKW KEKTGKEITA FVPHSWDATI LLMLAAEAAK 
ANTGEAIQSK LREVANAPGT EVTDPCEAME LVRKGEDINY QGASGNVDID ENGDVVGSYD 
VWTVKEDGKT EVIDKVSPAQ