Gene Rru_A2014 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rru_A2014
Symbol
ID	3835439
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Rhodospirillum rubrum ATCC 11170
Kingdom	Bacteria
Replicon accession	NC_007643
Strand	-
Start bp	2328282
End bp	2329886
Gene Length	1605 bp
Protein Length	534 aa
Translation table	11
GC content	64%
IMG OID	637826114
Product	twin-arginine translocation pathway signal
Protein accession	YP_427101
Protein GI	83593349
COG category	[E] Amino acid transport and metabolism
COG ID	[COG0747] ABC-type dipeptide transport system, periplasmic component
TIGRFAM ID	[TIGR01409] Tat (twin-arginine translocation) pathway signal sequence

Plasmid Coverage information

Num covering plasmid clones	6
Plasmid unclonability p-value	0.533924
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGTCCCTGT CCCGCAGAAG TTTTCTTGCC TCAACCGCCC TTCTGGCGGG AGCGGCGGCC 
CTGCCGCGTT TCTCCTGGGC GCAGGGCGCC CCGGCGCCGG TCGCCGGCGG CGTGTTGACC 
GCCCATCTCA GTTCCGAGCA GCGCATCCTC AATCCGGCGC TGCGCGCCTC GACGGGGGTC 
TATGTCATCA CCAGCAAGAT CATCGAATCG CTGGTTGATC TTGGCCCCGA TGGCGCGCCG 
ACGCCGGTTC TCGCCACGCG TTGGGAGGCC GCCGCCGATG GCAAATCGGT GACCTTCACC 
CTGCGCGAGG GGGTGAAGTG GCACGACGGC AAGCCCTTCA CCTCGGCCGA CGTTCAGTAT 
TCGGCGATGG AGCTGTGGAA GAAGCACCTG AATTACGGCA CCCAGCTTCA GCGCTATCTG 
GAAGCCGTCG ACACCCCCGA CGCCACCACG GCGATCTTCC GCTATAGCCG GACCATGCCG 
CTGCCCCTGT TGCTGCGCGC CCTGGCCGAT CTGGGCTATG TCGTGCCGCG CCATCTGTTC 
GAGGGCACCA ACGTTCTGGA AAACCCGGCG AATACGGCGC CGATCGGTAC CGGTCCGTTC 
AAATTCGTCG AATACCAGCG CGGCCAGTAT ATCGTCGCCG AGCGCAATCC CGAGTATTGG 
CGGAAGGGCG AACCCTATCT CGACCGCGTC GTCTGGCGCT TCATCACCGA TAAATCGGCC 
GCCAGCGCCG CCCTGGAAAC CGGGCAGGTG CAGATCAGCG CCTATACCCA GCTCGCCCTG 
TCGGACATCG AACGCCTGGC CAAGGATTCG CGCTTCGAGG TGTCGTCGCG CGGCAACGAG 
GCCAATTCGT TCAACAATAC GGTCGAGTTC AACCATCGCC GCAAGGAACT GGCCGATGTC 
CGCGTCCGCC GCGCCATCGC CCATGCCGTC GATGTCGATT TCTTCGTCGA GAACTTCCTC 
TATGGGCGCG GCAAGCGGGC GACCGGCTTC ATCCCGTCGA TTTCCCAGGC CTTTTATCCG 
GGCGGCGCCT TCCCCTATCC GTTTGACACC AAGAAGGCCG AGGCCCTGCT CGACGAGGCC 
GGCTATCCGC GCCAAAAGGG CGGCGAGCGC TTTTCGCTGC GCCTGTTGCC GATCCTGAAC 
GGCGAGGATG TGCCCCAGTT CGCCACCTTC CTTCAGCAGT CGCTGGCCGA GGTCGGCATC 
AAGGTCGAGA TCGTCCAGCT TGATGTCGCT GGCGCCCTGT CGGCGATCTA CAAGGATTGG 
AACTTCGATC TGGCGACCGG CTGGCACCAG TATCGGGGCG ATCCGGCGGT GTCGACCACC 
GTGTGGTTCC GCTCGGGTAG CCCCAAGGGC GCGCCGTGGA CCAACCAGTT CGGTTGGGAA 
TCGGCCGAGG TCGATACGCT GATCGACGAT GCCGCCGCCG AGATCGATCC GGTCAAGCGC 
AAGGCCCTTT ACGCCCAATT GGTCGATGTG ATCAACGAAG AGTTGCCGGT GTGGTTCGCC 
ACCGAGCGGC AATTCGTGTC GGTCACCAAT AAAGTCGTCC AAAACCACCA TAATATCCCG 
CGCTGGCCGT CCAGTGACTG GCATGATACC TGGATTGCCA AGTAG

Protein sequence

MSLSRRSFLA STALLAGAAA LPRFSWAQGA PAPVAGGVLT AHLSSEQRIL NPALRASTGV 
YVITSKIIES LVDLGPDGAP TPVLATRWEA AADGKSVTFT LREGVKWHDG KPFTSADVQY 
SAMELWKKHL NYGTQLQRYL EAVDTPDATT AIFRYSRTMP LPLLLRALAD LGYVVPRHLF 
EGTNVLENPA NTAPIGTGPF KFVEYQRGQY IVAERNPEYW RKGEPYLDRV VWRFITDKSA 
ASAALETGQV QISAYTQLAL SDIERLAKDS RFEVSSRGNE ANSFNNTVEF NHRRKELADV 
RVRRAIAHAV DVDFFVENFL YGRGKRATGF IPSISQAFYP GGAFPYPFDT KKAEALLDEA 
GYPRQKGGER FSLRLLPILN GEDVPQFATF LQQSLAEVGI KVEIVQLDVA GALSAIYKDW 
NFDLATGWHQ YRGDPAVSTT VWFRSGSPKG APWTNQFGWE SAEVDTLIDD AAAEIDPVKR 
KALYAQLVDV INEELPVWFA TERQFVSVTN KVVQNHHNIP RWPSSDWHDT WIAK