Gene Rcas_1709 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Rcas_1709
Symbol
ID	5539187
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Roseiflexus castenholzii DSM 13941
Kingdom	Bacteria
Replicon accession	NC_009767
Strand	+
Start bp	2204275
End bp	2206113
Gene Length	1839 bp
Protein Length	612 aa
Translation table	11
GC content	60%
IMG OID	640893848
Product	type II secretion system protein E
Protein accession	YP_001431819
Protein GI	156741690
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG4962] Flp pilus assembly protein, ATPase CpaF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	9
Plasmid unclonability p-value	0.708593
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	22
Fosmid unclonability p-value	1
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACCATAA CCCGCGTCAC TCCGAAAGCT GGCTCTACCT CGCCTCGATC CGCCTCCTCG 
GCCGCCGTCT CGCCAAAGCG TCGTGAGCCA GGGCACTCTT ATCATTGGAC TATTGGAGAG 
CTTCTTATTC CGGCATGCGA ACGCATCGTC ACGATCGAGG ATGCAGCCGA ACTGCGGTTT 
CATCGCACCC ATCCACACGT GGCGCGCCTT GAGGCGCGTC CACCGAATGT CGAAGGCGCT 
GGCGAAGTCA CGATTCGCCA ACTGGTGCGT AACGCGCTGC GTATGCGCCC GGATCGGATC 
ATCGTCGGCG AGGTGCGCGG CGCTGAGGCG CTCGACATGC TCCAGGCGAT GAACACCGGC 
CACGAAGGCT CGATGACGAC GGTGCACGCC AACTCGCCGC GTGATGCGTT CAGCCGCCTG 
GAGACGATGG TTATGTGGGC TGAGGGCGCC AGGGAGCTGC CGCTCAGCGC CATTCGGGAA 
CAACTCGTCG GCGCGCTCGA TATTGTCATT CAACAGACGC GCCTGCCCAA CGGTCGTCGC 
AAGGTTATCA GCATTTCCGA GGTTCAGGGC ATACGCCACG GTGAAGTCGA ACTGCGCGAC 
ATTTTTGTGT TTCACAGCAG TGTTGATGAC AAAGGTCAGG TGCTTGGCGA GTTTATGGCA 
ACCGGCGCCC TGCCGCGGTG CCTGCGCAAG ATTGAACCGG CGTGCGGCGC ACTCGATCAC 
CTGTTCAAGT CGAATTATCT GCGTGATACG CTTGGACCGG AGATTCTGCA GAACCCGGCG 
ATTACCGAGA TTATGGTCAA TGGTCCATTT GATGTCTGGA TCGAAGAGCG CGGCAAACTG 
CGTCCGGCGC CGGAGATCCG CTTCCGCGAC CATCACCATC TGCTGAATGT CATCAACACG 
ATCATCGCAC CGCTGAACCG TCGTCTTGAT GAGTTGAATC CGATGGTCGA CGCGCGTCTG 
CCGGATGATG AGCGCTTTCC CGGCGGTGGT CGCATCAACG CCGTTCTCGA CCCGATTTCT 
CTGGTTGGTC CGGTGTTGAC CATCCGGCGC TTCAGCCATA CCCCATTTAC GCTCGATCGA 
TTGGTGGCGC TTGGCAGTAT GTCGCCACAG ATGGCGGCAT TTCTGCGCGC GTGTGTTCGC 
ATCAGACGCA ACATGCTGAT CTCTGGCGGC GCCGGCAGTG GGAAAACCAC GTTGCTGGGC 
GCGATTGCAA AGGAGATCGA TCTGCAGCGT GAGCGCATTA TCACCATCGA AGACGCCGCA 
GAACTGCGCA TTGGCGCGCC AGGGGACCAC GTGCTCGGTC TCGAGACCCG TCCGCCCGAC 
CGATTTGGCG AAGGTGAGGT GACGATCCGC CAGCTGGTGC GCAATGCACT GCGTATGCGC 
CCCGACCGGA TTATTGTCGG CGAGGTGCGC GGCGCTGAGG CGCTCGATAT GCTGCAAGCC 
ATGAATACCG GGCACGAAGG CTCGCTCACT ACGCTGCACG CCAACTCGCC TCAGGAAGCG 
TTCAGTCGAT TGGAGACGAT GGTTCTCTGG GCGCGCGAAG CCGAGGCGCT CTCGCTCTCC 
GCCATCCGAC GTCAGTTGTG CACGCTCGAT ATTGTGGTTC AGCAGGCGCG CCTTGCCGAC 
GGCAGCCGCA AAGTCGTCGC TATTGCCGAA GTGGTTGGTC TTGATGAGCG TGACCAGGTG 
CACGTCGAGG AGATTTTTCG GTTCGAGCAG CATGGCATCG ATCCTGACGG CCAGGTGGTG 
GGTGAGCATG TTGCAACCGG CTACGTGCCG CGGGTGCTGG AAAAGTTGTG TGCATATGGC 
ATCACGCTGG AGGAAAAGGC ATGGTGCAGC CGATCATGA

Protein sequence

MTITRVTPKA GSTSPRSASS AAVSPKRREP GHSYHWTIGE LLIPACERIV TIEDAAELRF 
HRTHPHVARL EARPPNVEGA GEVTIRQLVR NALRMRPDRI IVGEVRGAEA LDMLQAMNTG 
HEGSMTTVHA NSPRDAFSRL ETMVMWAEGA RELPLSAIRE QLVGALDIVI QQTRLPNGRR 
KVISISEVQG IRHGEVELRD IFVFHSSVDD KGQVLGEFMA TGALPRCLRK IEPACGALDH 
LFKSNYLRDT LGPEILQNPA ITEIMVNGPF DVWIEERGKL RPAPEIRFRD HHHLLNVINT 
IIAPLNRRLD ELNPMVDARL PDDERFPGGG RINAVLDPIS LVGPVLTIRR FSHTPFTLDR 
LVALGSMSPQ MAAFLRACVR IRRNMLISGG AGSGKTTLLG AIAKEIDLQR ERIITIEDAA 
ELRIGAPGDH VLGLETRPPD RFGEGEVTIR QLVRNALRMR PDRIIVGEVR GAEALDMLQA 
MNTGHEGSLT TLHANSPQEA FSRLETMVLW AREAEALSLS AIRRQLCTLD IVVQQARLAD 
GSRKVVAIAE VVGLDERDQV HVEEIFRFEQ HGIDPDGQVV GEHVATGYVP RVLEKLCAYG 
ITLEEKAWCS RS