Gene Cyan8802_1033 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_1033
Symbol
ID	8390342
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	+
Start bp	1057158
End bp	1058408
Gene Length	1251 bp
Protein Length	416 aa
Translation table	11
GC content	37%
IMG OID	644979048
Product	extracellular ligand-binding receptor
Protein accession	YP_003136801
Protein GI	257058913
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0683] ABC-type branched-chain amino acid transport systems, periplasmic component
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.344987
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.000487812
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGGCGATTA AGCTGTTAAG CCAATTTTTA GTTATTTTAG TTGTTCTAGT CTCCTTATTC 
GTGAACAACC TAGTGTTGGC TAGTGAACAA TATAAAGACC CCATTGTCAT TGGAATGTCT 
GCCGCTTTCA CGGGAGCATC AAAAAATCTT GGCTTAGAAT TATATCATGG CTCAATGGCT 
TATATCAACA AGATTAATCA GTCGGGAGGC ATTAATGGTC ATCCCCTTGT AATTAAAGCT 
TATGATGATG GATATAATCC TTTACCCGCG ATTGAAAATA CGGTGAATCT GGTGGAAGAA 
GATGAAGTCA CTGTATTATT TGATTATGTA GGAGATCCCA CCGTTACTAA AATTTTACCA 
CTGTTAAAAA AATACGAAGC TAAAAATATC ATGCTATTTT TCCCCTTTAC AGGAGCCCAA 
TCCATGAGGC AAGTGCCTTA TAATCAATAT GTGGTTAATC TGAGGGCATC TTATCGGGAA 
GAAACCGCCG GATTAGTAGA TCATTTATTA GGGATTGGCC ACAAGCGTAT AGCTGTATTT 
TATCAAATTG ATGCCTATGG TCGCAGTGGT TGGGATGGCG TACGCAAGGC ATTAGAAAAG 
TATGGACTAG ATATTGTTGC TGAAACGACC TATCGTCGAG GAACTGAATA TAATAGTAGT 
TTTAACCCTC AAGTTAAGAT TTTACAAGAG GCCGATCCCG ATGCTATTAT TTCTATTGGT 
AACTATCAAG CTTGTGCTGG ATTTATTCGA GATGCAAGAG ATGCAGATTG GGATATTCCT 
ATTGCTAATG TTTCCTTGGT GGGGAGCGAA AGTTTATTAA AATTATTATT AGAAACAGGT 
CGTAAAACCC AGAGAAACTA TACTCAGAAT TTAATTAATT CCGAGATTCT TCCTAGTTAT 
GAGGATCTTT CCCTCCCTGC TGTTAAAGAA TATCGTAATG CCATCAATAG CTATCGTGGA 
AAATCACCGA TCACGAAAGA GAATTATACT GAGTCAGGTT ATAATTATGT GAGCTTTGAA 
GGGTTTCTAA ATGCTAAATT AATGGTAGAG ATTTTAAAGC GTTGGACAGA TTTTTCTGAT 
CAAGATCAGC TTCATGAAAT TGTCGATCAT CTCAACGATT TTGATCTCGG CATTGGGGTT 
TCACTACAGT TTAAACATCC TGAACATCAA GGACTACACC AAGTCTATTA TACTACCGTT 
TCTAATAATA AATTTGTCCC CCTTAAAGAT TGGAGAAAAT GGTCAAAATG A

Protein sequence

MAIKLLSQFL VILVVLVSLF VNNLVLASEQ YKDPIVIGMS AAFTGASKNL GLELYHGSMA 
YINKINQSGG INGHPLVIKA YDDGYNPLPA IENTVNLVEE DEVTVLFDYV GDPTVTKILP 
LLKKYEAKNI MLFFPFTGAQ SMRQVPYNQY VVNLRASYRE ETAGLVDHLL GIGHKRIAVF 
YQIDAYGRSG WDGVRKALEK YGLDIVAETT YRRGTEYNSS FNPQVKILQE ADPDAIISIG 
NYQACAGFIR DARDADWDIP IANVSLVGSE SLLKLLLETG RKTQRNYTQN LINSEILPSY 
EDLSLPAVKE YRNAINSYRG KSPITKENYT ESGYNYVSFE GFLNAKLMVE ILKRWTDFSD 
QDQLHEIVDH LNDFDLGIGV SLQFKHPEHQ GLHQVYYTTV SNNKFVPLKD WRKWSK