Gene PCC7424_4954 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC7424_4954
Symbol
ID	7107020
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 7424
Kingdom	Bacteria
Replicon accession	NC_011729
Strand	+
Start bp	5502296
End bp	5503357
Gene Length	1062 bp
Protein Length	353 aa
Translation table	11
GC content	36%
IMG OID	643483166
Product	protein of unknown function DUF21
Protein accession	YP_002380176
Protein GI	218441847
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	63
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGTAGAGC TAGTTATTGT TGCTCTCTTA GTCATGGTTG GTTCTGGTAT CTGTGCTTGC 
ACTGAAACAG CGATTTTATC CGTTTCGCCG ATTAAAGTTA GGGAATTATC CCAATCTGGA 
CAAAAATCCG CCTCAGTTTT GTTAACGATT CGAGAAAATA TTAATCATCC TATTGCCACC 
ATTGTCATGA TTAATAATCT GTTTAACATT TTTGGCAGTA TTTTTATTGG AAGTATAGCC 
TCAAAAGTGT TAGGAAATAT GTGGCTAGGA TTATTTTCAG GAGTTTTTAC TTTTTTGATC 
ATTATTTTTG CGGAAATTAT CCCTAAAACT TTGGCTGCTC GTTATGCTAC TCAGATAGCG 
TTGTTTGTAG CGATTCCTCT CAAATTAATT ACTCAAATTT TTAAGCCCTT TACTGTCATC 
ATTGAAACCC TGACCTTACC CTTTACAAAA AAAGATAAAC TTCCCAGTAC CAGTGAAGCA 
GAAATTAAAA TTTTAGCGAG TATTGGTCGT CGGGAGGGGG TAATAGAAAA AGATGAATCA 
GAAATGATTG AGCGAGTCTT TCAATTAAAT GATCTTAAAG CAGAAGATTT GATGACTCCT 
CGAATTATTG TCACTTATCT CAAAGGAGAG TTAACCCTAG AGGAATGTCA AGATATAATT 
TCTCATTCAG AACATACTCG AATTTTAGTC ATTGGAGAAA CCATTGATAA AGTCTTAGGG 
ATAGCTTTAA AACATGAATT ATTAACCGCC ATTATTGAAG GAAAACAAAA GCAACCTATT 
TCAACTTTTA CCCGTTCAGT GAATTTTGTT TCTCAAGAGA CTAAAGCCAA TGAATTACTA 
AAAACGTTTC AGACATTAGG AGAACATTTA ATCGTCGTTC TTGATGAGTA TGGGGGAGTG 
GCTGGCGTTG TCACTCTAGA GGATGTGTTA GAAGTTTTAA TAGGGGAAAT TGTCGATGAA 
ACCGATAAGT TTGTCGATCT GCAACAAATC GCCCGACGGA AACGAAAAAT TTTATTAGAA 
GCCAGAGGAA TACAACAACA AGAAATGATA CAAGTTTCCT AA

Protein sequence

MVELVIVALL VMVGSGICAC TETAILSVSP IKVRELSQSG QKSASVLLTI RENINHPIAT 
IVMINNLFNI FGSIFIGSIA SKVLGNMWLG LFSGVFTFLI IIFAEIIPKT LAARYATQIA 
LFVAIPLKLI TQIFKPFTVI IETLTLPFTK KDKLPSTSEA EIKILASIGR REGVIEKDES 
EMIERVFQLN DLKAEDLMTP RIIVTYLKGE LTLEECQDII SHSEHTRILV IGETIDKVLG 
IALKHELLTA IIEGKQKQPI STFTRSVNFV SQETKANELL KTFQTLGEHL IVVLDEYGGV 
AGVVTLEDVL EVLIGEIVDE TDKFVDLQQI ARRKRKILLE ARGIQQQEMI QVS