Gene Cagg_3591 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cagg_3591
Symbol
ID	7269735
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chloroflexus aggregans DSM 9485
Kingdom	Bacteria
Replicon accession	NC_011831
Strand	+
Start bp	4367854
End bp	4369836
Gene Length	1983 bp
Protein Length	660 aa
Translation table	11
GC content	50%
IMG OID	643568399
Product	hypothetical protein
Protein accession	YP_002464865
Protein GI	219850432
COG category	[M] Cell wall/membrane/envelope biogenesis
COG ID	[COG1807] 4-amino-4-deoxy-L-arabinose transferase and related glycosyltransferases of PMT family
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	12
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	6
Fosmid unclonability p-value	0.00100041
Fosmid Hitchhiker	Yes
Fosmid clonability	hitchhiker

Sequence

Gene sequence

ATGCGTTATC ATTTCTCGCG TATACAGCTT CTGCCATTGG CAATGCTCCT TGCACTGCTC 
GTCATTTCCC TAAGCGCAAC ATGGATCTTA GCATCACGTC CATGGCGGAT TGATGCAGTC 
ATTGGCGGCG CTGACTCGGC TCTTGTTGGT TCGGGCTTTT TTACCAAAGA GCTGTCTTCT 
GATGGTACGC CATTTCGCTG GACGAGCGGG CCTGCCATTA TCAATCTCCC ACCGGTGCAT 
GCACGGTATA TTGTTACAAT GCGCGCCTAC GTTCCCAGTG ATGTGATTCC TTATTACGTT 
GAGATCAAAG ACCGTGCCTT TCCAGTGGCC ACAATCGTGG TTACAGATCA GCTCCCCGCC 
TTCCGCAGAT ACCATATCCT TTGGCAGTCA CCTGTAACCT ATCACTGGTT AGATTTGTTT 
ACACCACGTC GTTTCACCAT TGATGCTGAA ACGCAACATC GTAACCAAGA TGACCCTCGG 
TTGTTGGGGA TTGCAGTCAG CCAGCTGCAT ATTCGCAGTT CCAACACATT GGCAGTGCCG 
GTGATGCCAC TTATTACCGT TGGGTTAACT CTGCTTGGCT TTGCTCATCT GCTCTGGCCG 
TTGCGCGGCA AACGGCTTGT GTGGTTTGCT GTGGTTGCTC TCATCTTGCC AGTAGGATAC 
GACCTTCTCG TATGGCACCC GCTTCAGGGA AATGATTACA CGTGGCTACC ATTATCGTGG 
TTGCCGGGCA TGGTTGCGGC ATCGGTCATA GGTGTTGCAT TCGCTCAGCG TGCTGCTCTA 
TCACGTGGGG GAGCGTGGTT CGCAGCTTTG ATTGTCATCT TATTGATGGT GGCCGTCATC 
ACCACTTTGC AATGGCACTG GCTGGTTGAA GGACCTGATT ACCATTGGCA TCTGAACCAT 
GGCGGTTCTT GGCGCCGTGT GTTCCGCTCC CACCCTTTCT ACCCGTTTGG CTTGCCATTG 
ATTTTGTACG TAGGACAACT GGCTGGTGAC CAAGCACTGT TATTTGGACG TATTGCGGGG 
GCTGTCACTA CGTCTGTAGC TATCGTAGCT GTTGTGCTAT TAGTATGGCG GGTAATCGCG 
CCCGCATATG CATGGGTAGC GGGCATGATC ATGCTGGCAT CACCGGTCGT GGTATCTCAT 
GGGGCTTTGG CGAGCACTGA CGCACCTATG ACCGGTTTGG CAACATTGGC ATTGCTTGCT 
CTCCTGTGGC ACGAGCGGCT CCGTTGGCTT CAGATTGCAT TGGCCGGCAT GTGTCTTGGT 
TTAGCGTATC TCTTCCGCGT TCAAGTGACA ATGTTGCTCA TCTCCTCCTT GCTGTGGTTG 
TACTGGCAGT CGACTCCGGC ATTGCTGTCG CCGTCAACTC GACCGTTCGA TCCTCGTCGT 
TTGATAGGGC CGCTGGTCTG TCTGGGAGGA TTTTTGCTGA CGTCAGCACC ACAGTGGATA 
TTAGACATTC GGGATACTGG TTTTCCTTTT GTGACAAAGC AATACGTCAA TATTTGGGCA 
TTCGCTTTTA GCCATTCTAA CCCGTTGCCT GACGGTTCAA CCTTTGAACA ACTGTGGTTT 
ATTCTAACGT TTGATCCGTA CGCACTATGG CGTCATTGGC TCAGCAATAT CATCCAATTT 
AGTACAGATA CGATTCATCG CTTATTTGTA TGGCCATTTG GTTTTATTGC ATTTGGTGGA 
TTGATACTAA AAGGTGCTAT CTCTATCCGC CGTTACTGGC TTCTGCTGGT TTGGGTTGTA 
GTTTATGTTT TATTTGTGAT GCTTACTGCA AATAAAGAAC GGTTCTTCTT GCCTGTCGTG 
CCAGCATTGG CTGTTTTTGC TACTGCATTT CTTGCAGAGA TACATAATCG TGTTAGCCAA 
TGGGGAAGGC GATTTGTGTT CCTACCGATA TTGGTGAATG CGCTGCTAAT GTACTGGATT 
ATGATCCATC TTACGTTAGC AGAAGTTGAA TTGGCCGGTT ATGGATTTAC GCGGAATTGG 
TAG

Protein sequence

MRYHFSRIQL LPLAMLLALL VISLSATWIL ASRPWRIDAV IGGADSALVG SGFFTKELSS 
DGTPFRWTSG PAIINLPPVH ARYIVTMRAY VPSDVIPYYV EIKDRAFPVA TIVVTDQLPA 
FRRYHILWQS PVTYHWLDLF TPRRFTIDAE TQHRNQDDPR LLGIAVSQLH IRSSNTLAVP 
VMPLITVGLT LLGFAHLLWP LRGKRLVWFA VVALILPVGY DLLVWHPLQG NDYTWLPLSW 
LPGMVAASVI GVAFAQRAAL SRGGAWFAAL IVILLMVAVI TTLQWHWLVE GPDYHWHLNH 
GGSWRRVFRS HPFYPFGLPL ILYVGQLAGD QALLFGRIAG AVTTSVAIVA VVLLVWRVIA 
PAYAWVAGMI MLASPVVVSH GALASTDAPM TGLATLALLA LLWHERLRWL QIALAGMCLG 
LAYLFRVQVT MLLISSLLWL YWQSTPALLS PSTRPFDPRR LIGPLVCLGG FLLTSAPQWI 
LDIRDTGFPF VTKQYVNIWA FAFSHSNPLP DGSTFEQLWF ILTFDPYALW RHWLSNIIQF 
STDTIHRLFV WPFGFIAFGG LILKGAISIR RYWLLLVWVV VYVLFVMLTA NKERFFLPVV 
PALAVFATAF LAEIHNRVSQ WGRRFVFLPI LVNALLMYWI MIHLTLAEVE LAGYGFTRNW