Gene Caci_3744 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Caci_3744
Symbol
ID	8335097
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Catenulispora acidiphila DSM 44928
Kingdom	Bacteria
Replicon accession	NC_013131
Strand	+
Start bp	4225758
End bp	4228202
Gene Length	2445 bp
Protein Length	814 aa
Translation table	11
GC content	70%
IMG OID	644956884
Product	transcriptional regulator, XRE family
Protein accession	YP_003114487
Protein GI	256392923
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	1
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	26
Fosmid unclonability p-value	0.806714
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

GTGGAACCCA GCCCGCGCGA GCAGCCAGGC ACAGGGCATC GCGACTCGCT CGTCTCCGCC 
GCGTCATCGG TCACGACATC GGAGGAGCTC GCTGAGCTGT TGCGGGATCT TCGGCGTCGG 
CACGCGCGGA GACGGCGTGA CAGGAAACTG ACATACCGGG AGCTGGCTGC GGAGACCGGA 
TGGTCGCAGA CGGCGATCGC CGAATACTTC ACCGCCCGCA CGCTGCCACC GACGGACCGT 
TTCGACGCCT TGCTCGAAGT ACTGGGCGTC TCGCCGGCTG AACAGCGCGC GCTGGCCACC 
GCGCGTGACC GGGTGGAGGA GGTGAACCGG CGGACCGGGA ATCGCCGCGG CGCCCGCCGC 
CCCGAGCCCG GACCGGAGCG CGTGTCACCG CCCGGCACCG TGGCACATCG ACTGCCCGCC 
GCACCGCCCC TGTTCACCGG CCGTGCTCGG GAACTGGCGT GGCTGGACGC GGCGCTAGGG 
GCGGCGCTGG ACGAGCGGAC GCGGGCCGAC GACCGACCCC GGGTCTGCGC CATCGGCGGG 
ATGGGCGGCA TCGGCAAGAC CTGGCTCGCC CTGCACTGGG CGAATCAGCA TCTTGATCGG 
TTTCCCGACG GCCAGCTGTA TGTGGACCTG CGGGGATTCG ACCCCGCTGG TCAGCCCATG 
GCTCCGACTG CCGCCGTCCG CGGTTTCCTG GAGGCGTTGG GCGTGGCGCC CTCCGCGATC 
CCGGCCGCCC GCGACGCTCG CTTCGGCTTG TACCGCAGCC TGACAGCCGG TCGCAGAATG 
CTGATCCTCT TGGATAACGC CCGTGACACC GCGCAGGTGA CGCCGCTGCT GCCGGGCAGC 
GACGCGTGCA CCGTGCTGAT CACCAGCCGC CCGCAGCTGG CAGGACTGAT AGCCACGCAC 
GGCGTGTCCT CGGTCGCCTT GGACGTCTTG CCGCGGGACG AGGCTCGGCG GCTGCTCTCC 
CGCTATCTGG GGCGTGCGCG CCTCGACGCC GAACCCCAGG CGGCGGACGC CTTGCTGGCT 
TGCTGCGCCG GGCTGCCCCT CGCGGTGGGC ATCGTGGCCG CGCGTGCGAC GATCCACTCC 
GATCTGTCGC TTGGCGCGCT GGCCGCCGAA CTCGGCGAGG ACGCCTATCG GCTCGACGGC 
CTCGACGCCG GAGAGCCCCA GGCTGATCTG CGGGGCGTGC TGTCCTGGTC CAGCCGTGCT 
CTGTCGCCGG ATGCCGCGCG GGCCTTCGGG CTTCTCGGGA TCGCTCCCGG GCCCGACCTC 
GGGCAGACCG CCGCGGCGAG CCTGCTCGCC CTGACGGTGG CGAAGACCCG CACCGTGCTT 
CGCATGCTTG AGCACTCCTC GCTGATCGAA AGGCATGCGC CCGAGCGGTA CCGCATGCAC 
GATCTGGTGC GGCTGTACGC TGCCGAACAA GCTGCCGCTC AGCACGCTCC CGCCGAGGTG 
CAGGCGGCAC AACGGCGCTT GGCCGACAGC TACGTGCGTA CGGCCTACGA GGCTGTACGA 
CTGTTCGCAG ACCGCCCCGT CCCGCTGGCC GCCGAACCGG TCGAGGGCTC CATGGCCCAC 
TCGCTCGCTG ATCCCGCCTC GGCGATGGCC TGGTTCGATA CCGAGCACAC CAATCTGTTG 
GCCGCTCAAC GGACGGCTCA GAGCCTCGGC TGGGACGAAG CGGTCTACCT CCTGGCCTGG 
ACGCTCGATC CCTACCATCG GCGCCGTGGA CACCTCGAGT CTCAGGCCAC TGCCTGGGAG 
CTCGCCGTGA CCAGCGCCCG ATCTCTGCCC GACCAGGCGC TGCGGATCCT GGCGCACCAT 
ATGCTCGGCG ACGCCTACGC CCAACTCGGG AGGACCGCCG ACGCTCTGCG TGCGCTGCAC 
GAAGCCCTGA CCATGGCCGA GCAGGCCGAT GACGTCAGCA GCCAGGGCGA GATCCACCAC 
AGTCTGGGCG GCGCCTGGGA GCGGCACGGC GACGACCGGC ACGCGCTGGA GCACGCACGC 
CGCGCCGTGC TGATCTTCCA GTCGCTGGAC GACCTTTACC GGCAAGCCCG AGGACTCAAC 
GGCGTGGGCT GGTTGCAGGC TCGGATAGGC GAGCACATGG AGGCCCGCAC CAACTGCCAG 
GCCGCACTGG CTCTGCTGCG CCGGCTGCCC TCCGACGATC AGCGGGTCGG TGAATCCGAC 
ATCCTCGACA GCCTCGGATT CATCGCCCAC CGCCTGCACG AATACGACCG AGCGCTCGAA 
CACTTCCGCC AGGCGCTGGC GATCTGCCGC GCCCAGGGCC ACAGCTATCT CGAGCCGGAC 
ATCCTCCACC ACATCGCCGA GACCCATTGC GCGCAATGCA ATATCGAGCA GGCCCGTGAC 
ACATGGCAGC GTGCGCACAC GCTCTACGCC GAGCAGCATC GACTCACGGA CGCGTCACGC 
GTCCAGCAGC GGTTGGACGC GCTTCCGGCA CCGGCTGCGT CGTAG

Protein sequence

MEPSPREQPG TGHRDSLVSA ASSVTTSEEL AELLRDLRRR HARRRRDRKL TYRELAAETG 
WSQTAIAEYF TARTLPPTDR FDALLEVLGV SPAEQRALAT ARDRVEEVNR RTGNRRGARR 
PEPGPERVSP PGTVAHRLPA APPLFTGRAR ELAWLDAALG AALDERTRAD DRPRVCAIGG 
MGGIGKTWLA LHWANQHLDR FPDGQLYVDL RGFDPAGQPM APTAAVRGFL EALGVAPSAI 
PAARDARFGL YRSLTAGRRM LILLDNARDT AQVTPLLPGS DACTVLITSR PQLAGLIATH 
GVSSVALDVL PRDEARRLLS RYLGRARLDA EPQAADALLA CCAGLPLAVG IVAARATIHS 
DLSLGALAAE LGEDAYRLDG LDAGEPQADL RGVLSWSSRA LSPDAARAFG LLGIAPGPDL 
GQTAAASLLA LTVAKTRTVL RMLEHSSLIE RHAPERYRMH DLVRLYAAEQ AAAQHAPAEV 
QAAQRRLADS YVRTAYEAVR LFADRPVPLA AEPVEGSMAH SLADPASAMA WFDTEHTNLL 
AAQRTAQSLG WDEAVYLLAW TLDPYHRRRG HLESQATAWE LAVTSARSLP DQALRILAHH 
MLGDAYAQLG RTADALRALH EALTMAEQAD DVSSQGEIHH SLGGAWERHG DDRHALEHAR 
RAVLIFQSLD DLYRQARGLN GVGWLQARIG EHMEARTNCQ AALALLRRLP SDDQRVGESD 
ILDSLGFIAH RLHEYDRALE HFRQALAICR AQGHSYLEPD ILHHIAETHC AQCNIEQARD 
TWQRAHTLYA EQHRLTDASR VQQRLDALPA PAAS