Gene PCC8801_2086 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	PCC8801_2086
Symbol
ID	7104324
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8801
Kingdom	Bacteria
Replicon accession	NC_011726
Strand	+
Start bp	2157309
End bp	2158463
Gene Length	1155 bp
Protein Length	384 aa
Translation table	11
GC content	47%
IMG OID	643475143
Product	protein of unknown function DUF58
Protein accession	YP_002372274
Protein GI	218246903
COG category	[R] General function prediction only
COG ID	[COG1721] Uncharacterized conserved protein (some members contain a von Willebrand factor type A (vWA) domain)
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	n/a
Plasmid unclonability p-value	n/a
Plasmid hitchhiking	n/a
Plasmid clonability	n/a

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAAACTT TATCTTCTTT GACTGAATGG TTAGAAACCC ATTGGGTGAC CCCTGCTTTT 
AGTGGCTGGT TATTAGCGGG ACTGGCTATC TGTTTTTTTG GGGCAGCTAC TAATACCATG 
GCCGGCTGGT TATACGTTCT GAGTGGGACT ATTTTTGCCT TATTGGGGTT AGGGGCAATT 
TTACCGATGC GATCGCAACG TCACCTTAAA GTCCATCGTC CTCTCATTTC CCCCGTCAGT 
GCAGGAGAAG AGCTTACGAT TGAACTCATC ATCGAAAATA CAGAGAAAAC CGCCAAAACC 
CTGCTAGAAG TTAGGGATCT GGTTCCCCAT GTCCTCAGAA CCCCCGTTAA AACCGCTATT 
GAAGTGATTC CTCCCCAAAA TAAGTATTCG TGGATCTATT ATCTCCCAAC GCAACGACGG 
GGAGTTTATC GTTGGCAAGA GGTGGAAGTG CGAACGGGAA CCCCCCTAGG ACTGTTTTGG 
TGTCGTCGTC ACCAAGAAGT CCCGGCTAAG GGTATTGTTT ACCCACAGGT TTTACCCCTT 
ACGCAATGTC CTCTAGTGGA TACCATCGGA CAAGAGGACA GTGATACTCT ACAGAGCGAT 
CGCCACTATC AAGCTGCCAA CGAAGGGGTA ACAAAAACCC TACGTCCCTA CCGTTATGGC 
GATCCTATGC GTCTGATCCA TTGGCGTACC AGTGCCCGTT TTGATGAATT TAAGGTCAGA 
GAATTGGAAA TTATCACCGG AGGAGAGGAC ATTCTCATCT GTCTCGATAG TGCTTCTCCA 
TGGCAACCTG ATAATTTTGA ACAAGCGGTA ATTGCCGCCG CTTCGTTATA TTTTTATGCC 
CTACGTTCAG AACTCAATGT TAAATTTTGG ACGGCTGGAA CGGGGGTTAT TCATGGCAAC 
CGTCAAGTAT TAGAAACCTT AGCAGCGATC GCATCAGAAG AAGAGACACT TAATCTACCT 
TTTCCCAAGT TACCGACGAT TTGGCTCACC CAAAATACCG CTACCTTAGA CACCCTTTCT 
CAGGGAAGTC GTTGGGTGGT TTTTGCTACA GGACAAACCC CAGATGCTCA ACAACTAATA 
AACCCTTCTA CCGGTGGTTT AGTCATTGAT CCTGAGCAAC CGTTAGCCCT CCAATTACAA 
AAACCGTTAA GATGA

Protein sequence

MKTLSSLTEW LETHWVTPAF SGWLLAGLAI CFFGAATNTM AGWLYVLSGT IFALLGLGAI 
LPMRSQRHLK VHRPLISPVS AGEELTIELI IENTEKTAKT LLEVRDLVPH VLRTPVKTAI 
EVIPPQNKYS WIYYLPTQRR GVYRWQEVEV RTGTPLGLFW CRRHQEVPAK GIVYPQVLPL 
TQCPLVDTIG QEDSDTLQSD RHYQAANEGV TKTLRPYRYG DPMRLIHWRT SARFDEFKVR 
ELEIITGGED ILICLDSASP WQPDNFEQAV IAAASLYFYA LRSELNVKFW TAGTGVIHGN 
RQVLETLAAI ASEEETLNLP FPKLPTIWLT QNTATLDTLS QGSRWVVFAT GQTPDAQQLI 
NPSTGGLVID PEQPLALQLQ KPLR