Gene PCC8801_2432 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2432
Symbol
ID	7101577
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	-
Start bp	2509088
End bp	2510419
Gene Length	1332 bp
Protein Length	443 aa
Translation table	11
GC content	46%
IMG OID	643475476
Product	protein of unknown function DUF21
Protein accession	YP_002372599
Protein GI	218247228
COG category	[R] General function prediction only
COG ID	[COG1253] Hemolysins and related proteins containing CBS domains
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCTGCGA TCGCCACCGA AATTATTTTT ATTCTTCTGC TGATTATCGC CAATGGGATC 
TTTTCTGGTT CAGAGATGGC TATCGTCTCC TCTCGTAAAG TCCGTTTAGA ACAACTGGCT 
AGTCGAGGCA ATCGTCAGGC AAGAACGGTA CTAAATCTCA TCAATGCCCC GAATAACTTC 
CTCTCTACCG TACAAATTGG GATTACCCTG ATTGGGATTC TCAGTGGTGC AATAGCCGGA 
GCAACCCTAG CTGAACGATT AACGGCGATC TTCCAAAGGA TTCCTCTATT AAAAGCTTAC 
AGTCAAGGTA TTAGTGTCGG TATTGTCGTC GGGGTGATTA CCTTTCTTTC CTTAGTGATG 
GGCGAATTAG TCCCCAAACG CATCGCCCTC AATGCACCTG AAAAAATTGC TTGTGCAGTG 
GCACAACCGA TGAAACTGCT CTCGCGTTTT GCAGCCCCTA TCGTCAATTT ATTGAGTGCC 
TCGACGGATT TTTTACTAAA ATTATTGGGG ATTAAAGTTT CCGATGAACC AGCCGTAACA 
GAAGAGGAAA TTAAGGTACT CATTCGTCAA GGGGCTGATT TGGGGTTATT TGAGGAGTCT 
GAACACGAAA TGGTAGAACG GGTATTTCGT CTAGGCGATC GCTCCGTTAA ATCCCTGATG 
ACCCCCCGTA AAGAGATAGT TTGGCTCGAT ATCGAGTCAC CCTTAGCGGA GAATTTGCAA 
GAGGTTATCG ATAGTGGCTA TTCACGTTTT CCTGTGGGAC GGGGGAGTTT AGATCAATAC 
ATGGGGGTAG TTCGAGGAAA CAGTCTGTTA GCTGCTTGTC TGTCGAACCA GGAGGTTGAT 
CTCGAATCTT TTCTACAACA ACCCCTCTAT ATTGCTGAAA ATACTCGCGC ATTAAACGTC 
CTAGAACAGT TTAAGCAAAC AGGCATCCAT ACAGCCCTGG TAATCGATGA ATACGGCGGA 
ATTGAGGGCT TAGTGACCCT TGATGATGTG GTAGAGGCGA TTTTAGGTGA ATTACCCTCG 
GCCGAGGATC TTGAGGCTCC CATGGCGGTT CAACGGGAAG ATGGTTCCTG GTTGTTGGAT 
GGGTTACTGG CGATCGATGA TTTTAAAGAG CTTTTCTCAG ATCTGCCACT TCCGGAAATT 
TCCTCTCAAC AGTACCATAC CCTCGGCGGT TTCATGATGT ATTCTCTCAA GCGCATCCCC 
CAAGCAAGTG AGTATTTTGA GTGGGGAAGG TTACGCTTGG AAGTGGTAGA TATGGATGGA 
ACACGAGTCG ATAAGGTATT AGTGACGGTT CTCGACAATG CTCCCGAAGA TGAACCGATT 
AACGAGGAGT AG

Protein sequence

MSAIATEIIF ILLLIIANGI FSGSEMAIVS SRKVRLEQLA SRGNRQARTV LNLINAPNNF 
LSTVQIGITL IGILSGAIAG ATLAERLTAI FQRIPLLKAY SQGISVGIVV GVITFLSLVM 
GELVPKRIAL NAPEKIACAV AQPMKLLSRF AAPIVNLLSA STDFLLKLLG IKVSDEPAVT 
EEEIKVLIRQ GADLGLFEES EHEMVERVFR LGDRSVKSLM TPRKEIVWLD IESPLAENLQ 
EVIDSGYSRF PVGRGSLDQY MGVVRGNSLL AACLSNQEVD LESFLQQPLY IAENTRALNV 
LEQFKQTGIH TALVIDEYGG IEGLVTLDDV VEAILGELPS AEDLEAPMAV QREDGSWLLD 
GLLAIDDFKE LFSDLPLPEI SSQQYHTLGG FMMYSLKRIP QASEYFEWGR LRLEVVDMDG 
TRVDKVLVTV LDNAPEDEPI NEE