Gene Syncc9605_2079 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Syncc9605_2079
Symbol	nusA
ID	3735810
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Synechococcus sp. CC9605
Kingdom	Bacteria
Replicon accession	NC_007516
Strand	+
Start bp	1900599
End bp	1902044
Gene Length	1446 bp
Protein Length	481 aa
Translation table	11
GC content	64%
IMG OID	637776665
Product	transcription elongation factor NusA
Protein accession	YP_382374
Protein GI	78213595
COG category	[K] Transcription
COG ID	[COG0195] Transcription elongation factor
TIGRFAM ID	[TIGR01953] transcription termination factor NusA

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.376983
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	12
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGGCTCTCG TCCTGCTTCC CGGTCTCAGC AACCTGATCG ACGACATCAG TGAAGAGAAG 
AAGCTGCCGC CTCAGGTGGT GGAAGCGGCC CTGCGGGAGG CCCTGCTGAA GGGCTATGAG 
CGCTACAGGC GCACCCTGTA TCTCGGCATC AGCGAAGACC CCTTTGATGA GGAGTACTTC 
AGCAACTTTG ACGTTGGCCT CGACCTGGAG GAGGAGGGCT ACAGGGTTCT CGCCAGCAAG 
ATCATTGTTG ATGAGGTGGA GAGCGAAGAC CACCAGATCG CGATCGCCGA GGTGATGCAG 
GTGGCCGATG ACGCCCAGGT GGGCGACACG GTGGTGCTGG ATGTCACCCC TGAGAAAGAG 
GATTTCGGCC GCATGGCCGC CGCCACCACC AAGCAGGTGC TGGCCCAGAA GCTGCGGGAT 
CAGCAGCGCC GCATGATCCA GGAGGAGTTC GCTGATCTGG AGGATCCGGT GCTGACGGCC 
CGGGTGATCC GCTTCGAACG GCAGTCGGTG ATCATGGCGG TCAGCTCAGG CCTGGGCCGT 
CCGGAAGTGG AGGCGGAGCT GCCCCGGCGC GATCAGCTGC CCAACGACAA CTACCGCGCC 
AATGCCACCT TCAAGGTCTT CCTGAAAGAG GTGAGCGAAG TGCCCCGCCG GGGACCGCAG 
CTGTTCGTCA GCCGCTCCAA TGCTGGGCTG GTGGTGTATC TGTTCGAGAA CGAAGTTCCC 
GAAATCCAGG AAGGATCCGT TCGGATCGTG GCCGTGGCCC GTGAAGCCAA TCCCCCCTCC 
CGTTCCGTGG GCCCCCGCAC CAAGGTGGCC GTCGACAGCA TTGAACGCGA GGTGGACCCG 
GTCGGCGCCT GCATCGGCGC CCGCGGCTCC CGCATCCAAC AGGTGGTGAA CGAACTGCGT 
GGAGAAAAAA TCGACGTGAT CCGCTGGTCC CAGGATCCGG GCCAATACAT CGCCAATTCC 
CTCAGCCCCG CTCGGGTGGA AATGGTGCGT CTGGTGGATC CCGTGGGCCA GCACGCCCAT 
GTGCTGGTGC CCCCCGATCA GCTGAGCCTG GCCATCGGCC GCGAGGGCCA GAACGTGCGT 
TTGGCCGCCC GACTCACCGG CTGGAAGATC GACATCAAGA ACTCCACCGA ATACGACCAA 
GAGGCCGAGG ATGCCGTGGT GGCGGAGCTG ATCTCCCAGC GGGAGGAAGA GGAAGCGCTC 
CAGCAGCAAG CCGAGGAACG GCTGGCCGCC GAACAGGCCG CTCGGGCGGA AGAGGATGCA 
CGCCTGCGGG AGCTGTATCC GCTGCCCGAA GACGAAGAGG AGTACGGCGA GGAGCAGCCC 
GAGCAGGAGT TCTCTGAGGA GGAGCCCGCT GAGGTGGAAG CCGGCACCGA GTCCGAGACC 
GAAGCCACGG ATGCAGCGGT TGAAGCCGAT GCGGATGCCG ATCCCGATCA GGAGCAGGTC 
CGGTGA

Protein sequence

MALVLLPGLS NLIDDISEEK KLPPQVVEAA LREALLKGYE RYRRTLYLGI SEDPFDEEYF 
SNFDVGLDLE EEGYRVLASK IIVDEVESED HQIAIAEVMQ VADDAQVGDT VVLDVTPEKE 
DFGRMAAATT KQVLAQKLRD QQRRMIQEEF ADLEDPVLTA RVIRFERQSV IMAVSSGLGR 
PEVEAELPRR DQLPNDNYRA NATFKVFLKE VSEVPRRGPQ LFVSRSNAGL VVYLFENEVP 
EIQEGSVRIV AVAREANPPS RSVGPRTKVA VDSIEREVDP VGACIGARGS RIQQVVNELR 
GEKIDVIRWS QDPGQYIANS LSPARVEMVR LVDPVGQHAH VLVPPDQLSL AIGREGQNVR 
LAARLTGWKI DIKNSTEYDQ EAEDAVVAEL ISQREEEEAL QQQAEERLAA EQAARAEEDA 
RLRELYPLPE DEEEYGEEQP EQEFSEEEPA EVEAGTESET EATDAAVEAD ADADPDQEQV 
R