Gene Sare_2371 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Sare_2371
Symbol
ID	5705112
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Salinispora arenicola CNS-205
Kingdom	Bacteria
Replicon accession	NC_009953
Strand	+
Start bp	2724741
End bp	2725694
Gene Length	954 bp
Protein Length	317 aa
Translation table	11
GC content	67%
IMG OID	641271849
Product	Sec-independent protein translocase, TatC subunit
Protein accession	YP_001537220
Protein GI	159037967
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG0805] Sec-independent protein secretion pathway component TatC
TIGRFAM ID	[TIGR00945] Twin arginine targeting (Tat) protein translocase TatC

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	7
Fosmid unclonability p-value	0.0057855
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

GTGGCCTTTG CCCTGCGTAA ACGCGGCCCG AGCAGCTTCC AGCGGGCCTC GGAAGGCTCG 
ATGACCCTGG TCGAGCACGT CCGCGAGTTG CGCGACCGGC TGTTCCGCGC GTCGCTGGCT 
GTCGTCGCCG GCCTGATTGT CGGTTTTGTC CTTGCGCAAC CGGCATTCGA TCTGCTGAAA 
GAGCCCTACT GCAACCTCCC GGACTCCACG AACGCGGACG GGGTGTGCCA GGGGTTCCTG 
CAGCTGTCCC CAGCGGACGG GTTCCTCCTC AAGCTCAAGC TGGCCCTGTG GATCGGCCTG 
ATCGTCGCGG CACCAGTCTG GCTCTATCAG CTCTGGGCGT TCATCGCGCC GGGTCTGCAC 
CGGCACGAGC GTAAATGGGC GTACGTCTTC GTCGCCATCG CCGCCCCGCT CTTCGCCGGT 
GGCGCCGTCC TCGCCTACCT GGTGGTGGAC AAGGGCCTGG CGTTTCTCAT GGAATCCGGT 
GTCACCGGGC TGTCCACGCA ACTCGAGGTG ACCCGCTACA TCTCGTTCGT CACGACCATG 
ATCCTGCTCT TTGGGGTGGC GTTCGAGTTT CCCCTGATCC TGCTGATGTT GAACTTCACC 
GGGGTGGCCA CCGCGCGGCG GCTGCTCAGC TGGTGGCGCG TGGTGATCTT CGTCTGCTTC 
GCCTTCGCCG CCATCGCGAC CCCGGATCCG GGGCCCTTCG GGATGACGTT GCTCGCCCTG 
TCGCTGTCGC TGCTGTACTT CGTCGCCGTG GGCGTCGCGT TCCTCAACGA CAGACGTCGG 
GGGCGCGGTA AGGAGATCTA CGCAGGCCTC GCCGACGACG AGGTGTCGCC GCTGAAGGAC 
GACAACGAGC CGATCGAGGC CAGTGCCCCG GTCGGCGCGC CCGACTCGAT CGCGGAGCCC 
GAGCCGGTTG CCAAGCCCGC GCCGATCGAG CGTCGCTACG ACGACATGAC CTGA

Protein sequence

MAFALRKRGP SSFQRASEGS MTLVEHVREL RDRLFRASLA VVAGLIVGFV LAQPAFDLLK 
EPYCNLPDST NADGVCQGFL QLSPADGFLL KLKLALWIGL IVAAPVWLYQ LWAFIAPGLH 
RHERKWAYVF VAIAAPLFAG GAVLAYLVVD KGLAFLMESG VTGLSTQLEV TRYISFVTTM 
ILLFGVAFEF PLILLMLNFT GVATARRLLS WWRVVIFVCF AFAAIATPDP GPFGMTLLAL 
SLSLLYFVAV GVAFLNDRRR GRGKEIYAGL ADDEVSPLKD DNEPIEASAP VGAPDSIAEP 
EPVAKPAPIE RRYDDMT