Gene PCC7424_4971 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC7424_4971
Symbol
ID	7107037
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 7424
Kingdom	Bacteria
Replicon accession	NC_011729
Strand	+
Start bp	5523338
End bp	5524417
Gene Length	1080 bp
Protein Length	359 aa
Translation table	11
GC content	46%
IMG OID	643483182
Product	biotin synthase
Protein accession	YP_002380192
Protein GI	218441863
COG category	[H] Coenzyme transport and metabolism
COG ID	[COG0502] Biotin synthase and related enzymes
TIGRFAM ID	[TIGR00433] biotin synthetase

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	55
Fosmid unclonability p-value	0.819396
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGTTCAAG CATCCCTATC TTCACCCATT ACCCCTCCTA AAGATACCCA AGCTTTACAA 
GAATGGCTTC ATCAACTGGC CGATCGCATT ATCTCAGGAT ATCGTATTAC TAAAGTAGAA 
GCCCTGGCCT TAACCGAAAT CGAAGGGCAA GATCAGATAC TCCTATTGTG TGAAGCGGCT 
GATCGCATTC GTCAAGCCTG TTGCGGTAAT AGGGTTGATT TATGTAGCAT TATCAATATA 
AAATCCGGCC ACTGTTCGGA AAATTGTAGC TTTTGTTCTC AATCTGTCCA TCATCCGGGT 
CAAGATTCCC CAGTCTATGG ACTCAAAACC TCAGAAGAAA TTGTACAACA AGCCAAAGCC 
GCCGCCGCCG CCGGTGCTAA ACGGTTTTGT TTAGTCAGTC AAGGACGAGG ATTAAAATAC 
AATAGCCCCA AATCTAAAGA ATTTGCAGAA ATTTTAGCCA CTGTAAAACG CATCACCACA 
GAAGCCAAGA TCAAACCCTG TTGCGCCTTA GGAGAATTAA CCCTCGAACA AGCACAGGCA 
TTAAAAGAAG CCGGTGTTAC CCGTTATAAC CATAATTTAG AAGCCTCAGC AACATTTTAC 
CCCCAAATTG TCACGACTCA TACCTGGGCC GATCGCGTGG AAACGGTAAA AAATCTTAAA 
GCCGCCGGCA TTCAAGCCTG TACCGGTGGC ATTATTGGTA TGGGAGAAAG TTGGGAAGAC 
CGGATCGATT TAGCCCTATC TTTACGAGAC TTAGAGGTAG ATTCTGTGCC GATTAATCTC 
CTTAACCCCA GACAAGGGAC TCCCTTAGGC CATCTCCCCA AACTTGACCC GTTTGAAGCG 
TTACAGGCGA TCGCTATTTT CCGCTTTATT TTACCGCAAC AAATCCTCCG CTATGCAGGA 
GGACGAGAGG CCATCATGGG AGAGTTGCAA AGTTTAGGGT TAAAAGCGGG AATTAATGCT 
ATGCTAATTG GACATTATCT GACCACTTTG GGACAATCTC CCCAACAAGA TCAGGCCATG 
TTAAAATCTC TAGGGTTAGA GGGAGGTGAA GCCCCAATTC CCGGTGAATA CCAACCCTAA

Protein sequence

MVQASLSSPI TPPKDTQALQ EWLHQLADRI ISGYRITKVE ALALTEIEGQ DQILLLCEAA 
DRIRQACCGN RVDLCSIINI KSGHCSENCS FCSQSVHHPG QDSPVYGLKT SEEIVQQAKA 
AAAAGAKRFC LVSQGRGLKY NSPKSKEFAE ILATVKRITT EAKIKPCCAL GELTLEQAQA 
LKEAGVTRYN HNLEASATFY PQIVTTHTWA DRVETVKNLK AAGIQACTGG IIGMGESWED 
RIDLALSLRD LEVDSVPINL LNPRQGTPLG HLPKLDPFEA LQAIAIFRFI LPQQILRYAG 
GREAIMGELQ SLGLKAGINA MLIGHYLTTL GQSPQQDQAM LKSLGLEGGE APIPGEYQP