Gene Jann_1555 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Jann_1555
Symbol
ID	3934003
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Jannaschia sp. CCS1
Kingdom	Bacteria
Replicon accession	NC_007802
Strand	-
Start bp	1525765
End bp	1526922
Gene Length	1158 bp
Protein Length	385 aa
Translation table	11
GC content	54%
IMG OID	637903906
Product	AraC family transcriptional regulator
Protein accession	YP_509497
Protein GI	89054046
COG category	[K] Transcription
COG ID	[COG2207] AraC-type DNA-binding domain-containing proteins
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	15
Plasmid unclonability p-value	0.294968
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	16
Fosmid unclonability p-value	0.931428
Fosmid Hitchhiker	No
Fosmid clonability	normal

Sequence

Gene sequence

ATGACATTGG ATATCGCCAT CAGCAGCGTC ACGGCAGGCA TTTGCCTGTT TTGCGCGCAT 
CTCCTGCTGC TCAGGCGGCG AGACACTGGG GTTTATCTGC CCCTTGCCTT GTTATTCCTG 
TTCCAGGGGA TCTCTACCGG CGTTGCCGCA CTGGCCGGAA CATATGATCC GGATAGTTTG 
GGCATCCTTT TCCGCATCAG CATCATTGTC GGTGGCCTGG AAATCACCCT TCCGTTTCTT 
CTTTGGGTCT ATGTGCGGGC GCTGACAACA GAAGGCCAAA CGGAACGTAT CCCGAAATTG 
CCGTATCACG TGATCCCGAT TGTTCTGGTT GTCCTCGCAT TCTGGTCGCT CTTGTTTCTT 
CCAGACGGAT TTGCAGACAC CGAATTGGAA GATGATGACC CGCGTTTGTT GGGATTTGTC 
GCTATCGCGC TGGCCGTTAT GCTTGCGGAT ATTGCGTTCA AAGCGATGGT AGCCACTTAC 
ATCTACCTGA TCATCCGCCG CCTCATGGCC TATCGCACGC GTCTAAAGGA TGTGTTCGCC 
AGCACCGAAA ACCGAGAACT AACTTGGATA TGGGTGATCT TGATTTGCAT GGCGGTCTAC 
CTCAGCGTGA GTATCGCCTT TACCGCGTCG ATTGTGTCCG GTGTTTTTGC CGAAGAAACC 
CAAGAAACGT GGTTGCCGAC GCTGAACGGT ATCGCGCTTC TTGGATTGTT CTGGGCCCTT 
GGCGTCTGGG GGTTGCGGCA GCGTCCCGGC CTGACGCGGC AGCCCGTCGT CGCCGCCCCG 
GAGCCCGATG ATCCCAAGCC GCGAAAATAT GAGAAATCCG CGCTTGATGA CGAACGGCTG 
CAACGCATTG CCCGGAAGGT TGAGGCGGCG ATGGCCGAAG ACACCCTCTA CCGTGATCCC 
AACTTATCAC TTTGGGATCT GGCAAAGCAC ATTGGCGTCA CGTCTCACTA TGTGTCTCAA 
GCGCTGAACA CCCATCTGAA CAAGAGTTTC TTTGACCTGG TGAATGGATG GCGGATCAAG 
GATGCCATCG AACAGTTGAC CACGACAGAT GAGACCATCT TGACGATTGC CTATGACGTC 
GGCTTCAACT CCCGCTCCGC ATTTTATAAA GCGTTCAAAC GCGAAACAGG GCGAACCCCT 
TCTGACCTGA GAAACTAG

Protein sequence

MTLDIAISSV TAGICLFCAH LLLLRRRDTG VYLPLALLFL FQGISTGVAA LAGTYDPDSL 
GILFRISIIV GGLEITLPFL LWVYVRALTT EGQTERIPKL PYHVIPIVLV VLAFWSLLFL 
PDGFADTELE DDDPRLLGFV AIALAVMLAD IAFKAMVATY IYLIIRRLMA YRTRLKDVFA 
STENRELTWI WVILICMAVY LSVSIAFTAS IVSGVFAEET QETWLPTLNG IALLGLFWAL 
GVWGLRQRPG LTRQPVVAAP EPDDPKPRKY EKSALDDERL QRIARKVEAA MAEDTLYRDP 
NLSLWDLAKH IGVTSHYVSQ ALNTHLNKSF FDLVNGWRIK DAIEQLTTTD ETILTIAYDV 
GFNSRSAFYK AFKRETGRTP SDLRN