Gene PCC8801_0144 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_0144
Symbol
ID	7104730
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	149943
End bp	151049
Gene Length	1107 bp
Protein Length	368 aa
Translation table	11
GC content	48%
IMG OID	643473259
Product	biotin synthase
Protein accession	YP_002370406
Protein GI	218245035
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

GTGGTTCAAG CCCCCTTATC ACCGTCTCTT CTTCAGACTC AATCCATTTC CCAACCGCCT 
CAAGAAACAG AGGCATTAAA AGCATGGCTT GAGGAATTAA CCCAAAAAAT CATCGAGGGC 
GATCGCATCA ATAAATCAGA AGCCCTCACC CTGACCCAAA TTGAAGGTCA AGACTCTATT 
CTTTTGCTAT GCGAAGCAGC CGATCGCATC AGACAAGCTT GTTGTGGCAA TGTAGTCGAT 
CTGTGTAGCA TTATCAACAT TAAATCCGGC AACTGTTCAG AAAATTGTCG CTTCTGTTCC 
CAGTCAGTTT ACCATCCAGG AGAAAATTCC CCCATTTATG GGCTAAAATC CTCAGAGGAA 
ATTCTCGCTC AAGCCAAAGC GGCTGAAGCG GCCGGGGCAA AACGCTTTTG TCTGGTCAGT 
CAGGGACGAG GACCGAAATA TCAAGGAGCA AAATCCAAGG AATTTGAGCA AATCTTAGCA 
ACCGTTCGGC AAATTGCCGC CGAAACCTCT ATTAAACCCT GCTGCGCTCT AGGGGAAGTG 
ACCCCAGAAC AAGCCCAGGC TTTAAGAGAA GCCGGAGTTA CCCGCTATAA CCACAATTTA 
GAAGCCTCAG AAGGATTTTA TCCCGAAATC GTCACCAGTC ATAGTTGGCG CGATCGCGTG 
GAAACCATTA AAAACCTCAA AGCAGCCGGG ATTCAAGCTT GTAGCGGCGG AATCATGGGC 
ATGGGAGAAA CTTGGGAAGA TCGGGTGGAT TTAGCCCTCG CTTTGCGGGA ATTAGGCGTA 
GAATCGGTTC CGATTAACCT CCTCAACCCC AGAGAAGGAA CCCCATTAGG AGACTGTCAT 
CGTCTAGATC CCTTTGAAGC TCTCAAGGCG ATCGCTATTT TTCGCTTGAT TCTCCCTCAA 
CAAATCCTGC GCTACGCGGG TGGACGGGAA GCGATTATGG GAGACTTACA AAGTCTAGGG 
CTAAAATCGG GAATTAATGC TATGCTGATT GGACATTATC TAACAACTCT AGGACAACCA 
CCAGAGAAAG ATCTGGCTAT GGTTGAATCT TTAGGCTTGC AAGGGGGTGA AGCTCCAATT 
CCTGGTGAAT ATCAAACGCG ATCGTAA

Protein sequence

MVQAPLSPSL LQTQSISQPP QETEALKAWL EELTQKIIEG DRINKSEALT LTQIEGQDSI 
LLLCEAADRI RQACCGNVVD LCSIINIKSG NCSENCRFCS QSVYHPGENS PIYGLKSSEE 
ILAQAKAAEA AGAKRFCLVS QGRGPKYQGA KSKEFEQILA TVRQIAAETS IKPCCALGEV 
TPEQAQALRE AGVTRYNHNL EASEGFYPEI VTSHSWRDRV ETIKNLKAAG IQACSGGIMG 
MGETWEDRVD LALALRELGV ESVPINLLNP REGTPLGDCH RLDPFEALKA IAIFRLILPQ 
QILRYAGGRE AIMGDLQSLG LKSGINAMLI GHYLTTLGQP PEKDLAMVES LGLQGGEAPI 
PGEYQTRS