Gene Rpal_1394 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rpal_1394
Symbol
ID	6409051
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodopseudomonas palustris TIE-1
Kingdom	Bacteria
Replicon accession	NC_011004
Strand	+
Start bp	1466905
End bp	1467993
Gene Length	1089 bp
Protein Length	362 aa
Translation table	11
GC content	67%
IMG OID	642711293
Product	chorismate synthase
Protein accession	YP_001990409
Protein GI	192289804
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0082] Chorismate synthase
TIGRFAM ID	[TIGR00033] chorismate synthase

Plasmid Coverage information

Num covering plasmid clones	17
Plasmid unclonability p-value	0.187693
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCGTTCA ATACCTTCGG CCATCTATTT CGCGTCACCA CCTTTGGCGA AAGCCATGGG 
GTGGCGATCG GCTGCGTGGT TGACGGCTGC CCGCCGCTGA TCCCGCTGAC CGAGGCCGAT 
ATCCAGGGCG ATCTCGACCG CCGCCGGCCC GGCCAGTCGC GCTTCACCAC CCAGCGCCAG 
GAAGCCGATC AGGTGAAGAT CCTGTCCGGC GTGATGGTGC ATCCCGAGAC CGGCGTGCAG 
GTGACGACCG GCACCCCGAT CGCGCTGTTG ATCGAGAATA CCGACCAGCG CTCCAAGGAC 
TATTCGGACA TCCAGAACAA GTATCGCCCC GGCCACGCCG ACTTCACCTA CGAGGCGAAG 
TACGGCATCC GCGACTATCG CGGCGGTGGC CGCTCCTCGG CGCGCGAGAC CGCGACCCGG 
GTCGCCGCAG GCGCGATCGC CCGCAAGGTG ATTGCCGGCA TGACCGTGCG CGGCGCGCTG 
GTGCAGATCG GTCCGCACAA GATCGACCGT GACAAATGGG ATTGGGACGA GATCGGCAAC 
AACCCGTTCT TCTGCCCGGA CAAGGACAAG GCGGCGTTCT ACGCCGACTA TCTCGACGGC 
ATCCGCAAAT CCGGCTCGTC GATCGGCGCG GTGGTGGAGA TCGTGGCCGA GGGCGTGCCG 
GCCGGGCTCG GTGCGCCGAT CTATGCCAAG CTCGACGGCG ACCTCGCCGC AGCGCTGATG 
AGCATCAATG CGGTCAAGGG CGTCGAGATC GGCGACGGCT TCGCCAGTGC CGAACTGACC 
GGCGAACAGA ACGCCGACGA GATGCGGACC GGCAATCATG GTCCGGCTTT CCTGTCGAAC 
CATGCCGGCG GCATCCTGGG CGGCATTTCC ACCGGCCAGC CGGTGGTGGC GCGGTTCGCC 
GTCAAGCCGA CCTCGTCGAT CCTGACCCCG CGCAAGACCG TCGATCGCAC CGGCCACGAC 
ACCGAGATTC TCACCAAGGG CCGCCACGAC CCCTGCGTCG GCATCCGCGC CGTGCCGGTC 
GGCGAGGCGA TGGTCGCTTG CGTGCTGGCC GACCACCTGC TGCGGCACCG GGGACAGGTC 
GGCGGCTGA

Protein sequence

MSFNTFGHLF RVTTFGESHG VAIGCVVDGC PPLIPLTEAD IQGDLDRRRP GQSRFTTQRQ 
EADQVKILSG VMVHPETGVQ VTTGTPIALL IENTDQRSKD YSDIQNKYRP GHADFTYEAK 
YGIRDYRGGG RSSARETATR VAAGAIARKV IAGMTVRGAL VQIGPHKIDR DKWDWDEIGN 
NPFFCPDKDK AAFYADYLDG IRKSGSSIGA VVEIVAEGVP AGLGAPIYAK LDGDLAAALM 
SINAVKGVEI GDGFASAELT GEQNADEMRT GNHGPAFLSN HAGGILGGIS TGQPVVARFA 
VKPTSSILTP RKTVDRTGHD TEILTKGRHD PCVGIRAVPV GEAMVACVLA DHLLRHRGQV 
GG