Gene Cyan8802_2075 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cyan8802_2075
Symbol
ID	8391391
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Cyanothece sp. PCC 8802
Kingdom	Bacteria
Replicon accession	NC_013161
Strand	-
Start bp	2088881
End bp	2089891
Gene Length	1011 bp
Protein Length	336 aa
Translation table	11
GC content	43%
IMG OID	644980053
Product	tryptophanyl-tRNA synthetase
Protein accession	YP_003137798
Protein GI	257059910
COG category	[J] Translation, ribosomal structure and biogenesis
COG ID	[COG0180] Tryptophanyl-tRNA synthetase
TIGRFAM ID	[TIGR00233] tryptophanyl-tRNA synthetase

Plasmid Coverage information

Num covering plasmid clones	3
Plasmid unclonability p-value	0.00113563
Plasmid hitchhiking	No
Plasmid clonability	decreased coverage

Fosmid Coverage information

Num covering fosmid clones	27
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGGCAAAC AACGAGTCTT ATCTGGAGTA CAACCCACGG GAAACCTGCA TCTAGGTAAC 
TATTTAGGGG CAATTCGCAA CTGGGTAGAG ATTCAGTCAA ATTACGAGAA TTTCTTTTGT 
GTGGTGGACT TACACGCCAT TACCGTCCCC CATAACCCGA AAACCTTAGC GCAAGATACC 
TATACCATCG CTGCCCTGTA TTTAGCCTGT GGCATCGATC TTAACCACTC TACCATCTTT 
GTTCAGTCCC ACGTCAGTGC CCATAGCGAA CTCGCCTGGT TACTCAACTG TCTTACTCCC 
CTCAATTGGC TAGAGAGGAT GATACAGTTC AAAGAAAAAG CCCTAAAACA AGGGGAAAAC 
GTCAGCGTTG GCTTATTAGA CTATCCCGTG TTGATGGCAG CAGATATCCT TCTGTATGAT 
GCTGATCGTG TACCCGTTGG GGAAGATCAA AAACAGCATT TAGAATTAAC TAGAGATATC 
GTTATTCGCT TTAATGACCA ATTTGCTACC CCCGAAAATC CCGTCTTGAA AATGCCTGAA 
CCCCTGATTC GGACTGAAGG GGCAAGGGTG ATGAGTTTAA CCGATGGAAC CCGCAAAATG 
TCAAAATCCG ATCCCTCGGA GATGAGTCGG ATTAATCTGT TAGATCCGCC CGAATTAATT 
CAAAAAAAGA TTAAACGTTG CAAAACCGAT CCCATTGTTG GATTAGAATT TGATAATCCA 
GAACGACCTG AATGTAACAA TTTATTGGGA CTGTATGGCT TATTATCCCA AAAGACGAAA 
CAAGAAGTCA TTACGGAATG TCAAGACATG GGATGGGGAA AATTTAAACC CCTACTAACG 
GAAACCACCA TCGAAGCCCT TAAACCCATT CAACTAAAAT ATCAAGAAAT CATGGATAAT 
AAGGATTATT TAGATTCGGT TTTGCGAGAG GGCAAAGAAA AAGCAGAAAC CGTCGCCAAT 
CAAACTTTAA CCCGGGTCAA AGAAGCGTTA GGTTATTTAG CCCCCCTTTA G

Protein sequence

MGKQRVLSGV QPTGNLHLGN YLGAIRNWVE IQSNYENFFC VVDLHAITVP HNPKTLAQDT 
YTIAALYLAC GIDLNHSTIF VQSHVSAHSE LAWLLNCLTP LNWLERMIQF KEKALKQGEN 
VSVGLLDYPV LMAADILLYD ADRVPVGEDQ KQHLELTRDI VIRFNDQFAT PENPVLKMPE 
PLIRTEGARV MSLTDGTRKM SKSDPSEMSR INLLDPPELI QKKIKRCKTD PIVGLEFDNP 
ERPECNNLLG LYGLLSQKTK QEVITECQDM GWGKFKPLLT ETTIEALKPI QLKYQEIMDN 
KDYLDSVLRE GKEKAETVAN QTLTRVKEAL GYLAPL