Gene Cag_1169 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1169
Symbol
ID	3747925
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	1563540
End bp	1564874
Gene Length	1335 bp
Protein Length	444 aa
Translation table	11
GC content	47%
IMG OID	637773703
Product	TPR repeat-containing protein
Protein accession	YP_379474
Protein GI	78189136
COG category	[N] Cell motility [U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG3063] Tfp pilus assembly protein PilF
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	24
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAAACCAT TTTTCACTTT TTTACGCTAT GCCTTCATTG GTATTTTAAC GCTTTCCCTT 
GTAACCCCTG AGGTTGTAGA TGCTGCTAAA AAATCCAAAA AGAAAAGCAG TAGCCGTAAA 
AAATCATCCA AACGTAACGC ACGCGCTAAA AAAGGCTCGA ATAAAAAAAC ATCAGCGCGG 
CAAGCTCGTT TACGCGTGGT TGATGGGGTA GAAACGGAAC GAAATTCCAT AAATCTTACT 
GCCTCGCCAT CAAGTGCTTC GCGTCAGCTC AATAAGCGAG CAATGGGATT TTATGAGCAA 
GGGCGTTATG CTGAAGCTGA GCCACTCTAT CGAGAATTAC TTACTCTTGA TGAAAAACAG 
TTAGGCAGTC GCCATCCCGA AGTTGCAGTT ACCTTAAACA ACCTTGCTTC ACTCTTGCAG 
CAACAAGGGC GATATAACGA AGCCGAGCCA CTCTATCGCC GTGCGCTCTC TATTCGCGAA 
GAAAATTTTG GGGCTGACGA TGCAAGTGTA GCGCAAAGCT TAAACAATCT TGGCTCGCTC 
TTGCAAGATC AAGGACGTTA CTATGAAGCA CGTCAGCTTT ATAGCCGCTC ACTTGCAATT 
GATGAAAAAG TGTTGGGAAC CGACCATCCC GATGTTGCCG CCGACCTCAA CAACCTTGCC 
TCACTACTAC AAGCACAAGG GCGTTATGCC GAAGCTGAGC CGCTCTATCG CCGTTCCTTA 
GCCATTCGTG AGCAACGATT TGGTGCAGAG CATACGCTGG TTGCTATGAG CCTCAATAAT 
CTTGGCGTGC TCTTGCAAGC ACAAGGGCGT TATAGTGAAG CCGAGCCACT CTATCGCCGC 
TCGCTTGCCA TTCGTGAGGC TCAATACCCC GCCAACAACC ACTCAATTGT TGCAACAAGT 
CTCAATAATC TTGCCTCCCT TTTGCAGGCA CGAGGAAAAC TTACTGAAGC TGAACCCATT 
TATCAGCGCG CATTGTCCAT CAACGAACAA ACCTTAGGTG AAAACCACCC ATCAGTTGCA 
ACAAGCCTCA ATAATCTTGC TGGGTTGCTT AGGGCACAAG GGCGATATGC CGATGCTGAA 
CCTCTTTACC GCCGCTCGTT AACAATACGT GAAGAACAGC TTGGCGAAAA CCACCCCGAT 
GTTGCTATGA GCCTCAATAA TCTTGGAGTG CTCTTGCAAG CACAAGGGCG TGCCAGCGAA 
GCCGAACCAC TCTATCGCCG AGCATTACTG ATTGATGAAA AAGTATTAGG AGCTACGCAC 
CCACAAACAA TCCGTTTACG CAATAATCTG AATGCTTTAC TGAATCCATC AGCAATACCA 
CTAACCACCC AATAA

Protein sequence

MKPFFTFLRY AFIGILTLSL VTPEVVDAAK KSKKKSSSRK KSSKRNARAK KGSNKKTSAR 
QARLRVVDGV ETERNSINLT ASPSSASRQL NKRAMGFYEQ GRYAEAEPLY RELLTLDEKQ 
LGSRHPEVAV TLNNLASLLQ QQGRYNEAEP LYRRALSIRE ENFGADDASV AQSLNNLGSL 
LQDQGRYYEA RQLYSRSLAI DEKVLGTDHP DVAADLNNLA SLLQAQGRYA EAEPLYRRSL 
AIREQRFGAE HTLVAMSLNN LGVLLQAQGR YSEAEPLYRR SLAIREAQYP ANNHSIVATS 
LNNLASLLQA RGKLTEAEPI YQRALSINEQ TLGENHPSVA TSLNNLAGLL RAQGRYADAE 
PLYRRSLTIR EEQLGENHPD VAMSLNNLGV LLQAQGRASE AEPLYRRALL IDEKVLGATH 
PQTIRLRNNL NALLNPSAIP LTTQ