Gene Synpcc7942_1201 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Synpcc7942_1201
Symbol
ID	3774437
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus elongatus PCC 7942
Kingdom	Bacteria
Replicon accession	NC_007604
Strand	-
Start bp	1229078
End bp	1230508
Gene Length	1431 bp
Protein Length	476 aa
Translation table	11
GC content	57%
IMG OID	637799628
Product	glycosyltransferase
Protein accession	YP_400218
Protein GI	81300010
COG category	[H] Coenzyme transport and metabolism [M] Cell wall/membrane/envelope biogenesis
COG ID	[COG0463] Glycosyltransferases involved in cell wall biogenesis [COG2226] Methylase involved in ubiquinone/menaquinone biosynthesis
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	16
Plasmid unclonability p-value	0.0256337
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	43
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGAATGACC ATACCGCCGC GATCGCGGCC CATTTTGATC AGCTAGCACC CAACCTCGAT 
CGCTGGCGGC GACGCAACCG CACCTACTAT CGCGATCTCG AAAAACTGCA TCGCTTCTGG 
ATTCCTACCG GATCACGAGT GCTGCAGGTT GGTTCTGGTT TGGGCGATCT GCTAGCAACG 
GTTGAACCAT CCTTCGGCAT CGGGATTGAT GTCTCACCGC AGGCGGTGGC AATCGCTCAG 
CAACGCCATC CACAGCTGCA GTTCCACTGC TTGGCTGCCG AAGAGTTGAC ACCCGAGGCG 
ATCGGCAATC CTGAGCCTTT TGACGCGATC ATCCTGACGG GAGTGCTCAG CTACCTGACG 
GATATTCAAG TTGTGCTGGA GCAGCTCCAA GCCTTTTGTC ATCCCCGCAC GCGCTTAATC 
CTTGGCTTCC ATAACTTCCT CTGGCAGCCC TTGCTCACGG CCGCTGAAAA GGTGGGACAG 
CGATCGCCCC AACCGCCCGA AAGCTGGCTG GGTATGCAGG ATGTGCTCAA TTTACTGACG 
CTGACGGGCT ATGAACCAAT CAAGCAGGGG CGGCGCTTCC TTCTGCCTCG GCAAATTCCG 
CTACTGACCG GCTGGATTAA CCGCTGGATC AGCCCGCTAC CGGTGATTGA GCATCTAGCG 
CTGACTAACT ATGTGATTGC GCGGCCCCTG GCTCAACCGC GATCGCAACC CACAGTCTCG 
GTGATTGTTC CGGCTCGCAA TGAGGCGGGC AATATTGCAG CAGCAGTCGA ACGCTTGCCA 
GAACTGGGGG CTGAGACAGA GCTGATCTTC GTGGAAGGCC ATTCCCGCGA TCAGACTTGG 
GAGACGATCG AGCAGACGGT GGCGGAGTAT CAAGGGCCGC TGAAACTGCT GGCCTGCCGC 
CAAACTGGCA AAGGTAAAGC CGATGCAGTC CGGCTCGGCT TCGATAAAGC CAGCGGCGAC 
ATTTTGATGA TTCTCGATGC TGACTTAACT GTGCAGCCGG AGGATCTCGG CCATTTCTAC 
CGCGCGATCG CCAGTGGCAG GGGCGAATTT ATCAACGGCT CTCGGCTGGT CTATCCGCGA 
TCGCGGCTGG CGATGCCGGG GCTGAATACC CTTGCTAATC GAACCTTCGC CCTGATCTTT 
TCCTTCCTAC TCGGTCAGCC GCTTAAGGAC ACCCTCTGCG GCACCAAGGT GCTCTGGAAA 
ACCGACTACG ATCGCGTGGC GGCAGGGCGG AAATACTTTG GTGACTTCGA TCCCTTTGGT 
GACTTTGACC TACTGTTTGG TGCCGCTAAA CTCGGCCTCA AAATTGTCGA AGTACCAGTG 
CGTTATCAAG AGCGCAGCTA CGGCAGTTCC AACATTGCTC ATGTCCGCGA AGGGCTGATT 
CTGGCACGGA TGTGTCTCTA CGCCGCTGGC AAACTGAAGT TCCCTCACTA G

Protein sequence

MNDHTAAIAA HFDQLAPNLD RWRRRNRTYY RDLEKLHRFW IPTGSRVLQV GSGLGDLLAT 
VEPSFGIGID VSPQAVAIAQ QRHPQLQFHC LAAEELTPEA IGNPEPFDAI ILTGVLSYLT 
DIQVVLEQLQ AFCHPRTRLI LGFHNFLWQP LLTAAEKVGQ RSPQPPESWL GMQDVLNLLT 
LTGYEPIKQG RRFLLPRQIP LLTGWINRWI SPLPVIEHLA LTNYVIARPL AQPRSQPTVS 
VIVPARNEAG NIAAAVERLP ELGAETELIF VEGHSRDQTW ETIEQTVAEY QGPLKLLACR 
QTGKGKADAV RLGFDKASGD ILMILDADLT VQPEDLGHFY RAIASGRGEF INGSRLVYPR 
SRLAMPGLNT LANRTFALIF SFLLGQPLKD TLCGTKVLWK TDYDRVAAGR KYFGDFDPFG 
DFDLLFGAAK LGLKIVEVPV RYQERSYGSS NIAHVREGLI LARMCLYAAG KLKFPH