Gene Rsph17029_1016 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rsph17029_1016
Symbol
ID	4895557
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodobacter sphaeroides ATCC 17029
Kingdom	Bacteria
Replicon accession	NC_009049
Strand	-
Start bp	1050386
End bp	1051564
Gene Length	1179 bp
Protein Length	392 aa
Translation table	11
GC content	72%
IMG OID	640111602
Product	hypothetical protein
Protein accession	YP_001042899
Protein GI	126461785
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0436] Aspartate/tyrosine/aromatic aminotransferase
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	24
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCCTGC CGCTCAACCC CGCGATGGCC GCGACCTTCC CGCCCCCGGT GATGGAGGCG 
CGGCGCTGGA TCCAGGGGCT GAGCTTCCCC GCCGACCGGC CGCTTCTCAA TCTGAGCCAG 
GCCGCGCCGG TGGAGCCGCC GCCGGCCGAG CTGAGGGCGG CCCTCGCCGA GGCCGCGCTC 
CACGATCCGC AGGCCCATCT CTACGGGCCG GTGCTGGGGT TGCCCGCGCT CCGCGCCGAA 
ATCGCGGTGC AGTGGTCGGC CGCCTATGGC GGGCGGATCG AGCCCGCGCA GGTCGCGATC 
ACGCAGGGCT GCAATCAGGC CTTCTGCGCG ATCATGGCGA CCCTCGCCGG AGCGGGAGAC 
GAGGTGATCC TGCCCACGCC GTGGTACTTC AACCACAAGA TGTGGCTCGA CATGCAGGGC 
GTGACGGCGG TGCCGCTGCC CACGGGCCCG GGCCTCCTGC CCGATGCGGA GGAGGCGGCG 
GCGCTTGTGG GCCCCCGGAC CCGCGCCATC GTTCTGGTGA GCCCCAACAA TCCGGGCGGG 
GTGGAATATC CGGCGGCGAC GCTCGAGGCC TTCCGCGATC TGGCCCGCGC GCGCGGCCTT 
GCGCTGATCG TGGACGAGAC CTACCGCGAC TTCGACAGCC GCACCGGCGC GCCGCACGCG 
CTCTTTGCCG ATCCGGACTG GGACGGGGTG CTGGTGCATC TCTATTCCTT CTCCAAGGCC 
TACCGTCTGA CCGGCCACCG GGTCGGCGCG GTGGTGGCCT CGGCGGCGCG TCTGGCGCAG 
ATCGAAAAGT TCCTCGACAC GGTGGCGATC TGCCCGAGCC AGCTCGGCCA GATCGGCGCG 
CTCTGGGGGA TGCGGCACCT CGCGCAGTGG GTGGCGGGCG AGCGCGCCGA GATCCTCGCG 
CGGCGCACGG CGATGGTGGG CGGCTTCTCG GCGCTCGACG GCTGGACGCT TCTCGGCTGC 
GGCGCCTATT TCGCCTATGT CGAACATCCG TTCGACACGC CCTCCGACCG GCTTGCCCCG 
CGGCTGGTGC AGGAGGCGGG CGTGCTTCTG CTGCCCGGCA CCATGTTCCA GCCCGAGGGG 
TCGGAGGCAG GGGCGCGCCA GTTCCGCATG GCCTTCGCCA ATGTGGATCA GGCCGGGATC 
GCCGAGCTGT TCTCGCGGCT GGCGCAGGTC ACGGACTGA

Protein sequence

MTLPLNPAMA ATFPPPVMEA RRWIQGLSFP ADRPLLNLSQ AAPVEPPPAE LRAALAEAAL 
HDPQAHLYGP VLGLPALRAE IAVQWSAAYG GRIEPAQVAI TQGCNQAFCA IMATLAGAGD 
EVILPTPWYF NHKMWLDMQG VTAVPLPTGP GLLPDAEEAA ALVGPRTRAI VLVSPNNPGG 
VEYPAATLEA FRDLARARGL ALIVDETYRD FDSRTGAPHA LFADPDWDGV LVHLYSFSKA 
YRLTGHRVGA VVASAARLAQ IEKFLDTVAI CPSQLGQIGA LWGMRHLAQW VAGERAEILA 
RRTAMVGGFS ALDGWTLLGC GAYFAYVEHP FDTPSDRLAP RLVQEAGVLL LPGTMFQPEG 
SEAGARQFRM AFANVDQAGI AELFSRLAQV TD