Gene Cagg_1902 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_1902
Symbol
ID	7266393
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	2333616
End bp	2334668
Gene Length	1053 bp
Protein Length	350 aa
Translation table	11
GC content	57%
IMG OID	643566739
Product	sortase family protein
Protein accession	YP_002463233
Protein GI	219848800
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG3764] Sortase (surface protein transpeptidase)
TIGRFAM ID	[TIGR01076] LPXTG-site transpeptidase (sortase) family protein

Plasmid Coverage information

Num covering plasmid clones	5
Plasmid unclonability p-value	0.0102426
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	17
Fosmid unclonability p-value	0.943943
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGCGGCGAT TACTTATCCT TTGTCTGATA GTATTGCTTC TTAGCCCGTT ACCGGTCGCT 
GCCAATACGG CTGCCGGTCA ACCGACCGTC TTCCGTGAGA CCGGTCATAC GTTGGCATAT 
GCCTTTCGTG AATTCTACGA CCGGCAAGGT GGTCTACCGA TTTTTGGCTA TCCACTCACC 
GAGGTGTTTA TTGAAGATGG CCGTCCGGTG CAGTATTTCG AGCGTGCCCG CTTCGAGTGG 
CACGCCGATT TGGCGTTGGT GCAGGTCGGG CATCTTGGGC GATGGGCGGC AACGGCGTAT 
GTCGATCATC CGGCGTTTGT ACCATTACCG ACAGCTCCGG CAAATGCCGA TTTCTTTCCC 
GAAACCGGTC ATAGTCTGAG TGGGGCTTTT CGTACTTTCT GGTGGCAAAA CGGTGGGTTG 
CCGACGTTCG GTTTCCCGCT ATCAGAACCG TTTGAGACCG TCGATGAGAA TGGTCAGCCG 
CGTGTGGTCC AGTTCTTTGA GCGGGCACGC TTTGAGTGGC ATCCGCAGAA CCCACCCCGC 
TACCAGGTGC TGCTCGGACA TTTGGGACGG GCATGGTTGG CCGCACATCC GGTGCCGGAA 
TGGTCACTAC AACCGGTGAC AAGCGGTGAT GCTGCGTGGG CTGCGGTTCG TCCGACGCGC 
GTGCGGGTAC CCCGCATCGG TGTCGATACC GAGGTTGTCA GTGCGGGATT TTCGTTTGGG 
GTGTGGGACG TTCCACGCTA TACGGCCGTC CACTACTGGC CGATCAGTGG CTATCCCGGC 
ACAACCGGCA ATATCGTGAT TGCCGGCCAT GTTGGGTATC GTGGAATTAT TTTCAATCAG 
CTACCGGCAA TTACGGTCGG CGATGAAGTA TTGGTCACGG TGAACGGTAA CGACCGTCGC 
TATGTGGTGC GTGAGGTTTT GACGGTGCTT CCCGATGCGA CGTGGGTGCT CGCACCGACA 
AGCAGCGAAA CGCTCACGCT GATTACCTGT GTACCGATTG GAGTCTATTC CCATCGGCTC 
ATTGTGCGTG CCACACCGGT GACCGATTCG TAA

Protein sequence

MRRLLILCLI VLLLSPLPVA ANTAAGQPTV FRETGHTLAY AFREFYDRQG GLPIFGYPLT 
EVFIEDGRPV QYFERARFEW HADLALVQVG HLGRWAATAY VDHPAFVPLP TAPANADFFP 
ETGHSLSGAF RTFWWQNGGL PTFGFPLSEP FETVDENGQP RVVQFFERAR FEWHPQNPPR 
YQVLLGHLGR AWLAAHPVPE WSLQPVTSGD AAWAAVRPTR VRVPRIGVDT EVVSAGFSFG 
VWDVPRYTAV HYWPISGYPG TTGNIVIAGH VGYRGIIFNQ LPAITVGDEV LVTVNGNDRR 
YVVREVLTVL PDATWVLAPT SSETLTLITC VPIGVYSHRL IVRATPVTDS