Gene Cag_1056 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1056
Symbol
ID	3747039
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	1436182
End bp	1437912
Gene Length	1731 bp
Protein Length	576 aa
Translation table	11
GC content	46%
IMG OID	637773587
Product	hemolysin activation/secretion protein-like
Protein accession	YP_379361
Protein GI	78189023
COG category	[U] Intracellular trafficking, secretion, and vesicular transport
COG ID	[COG2831] Hemolysin activation/secretion protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	0
Plasmid unclonability p-value	0.00000000536803
Plasmid hitchhiking	No
Plasmid clonability	unclonable

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGTTCCAA AAATTATAAC ATCTCTTGTA GCGGGAAGCG TGGTTTTTTC TGCTTCACTT 
CAAGCGGCTC CGCTTGTACC CAATGCGGGT AGCTTACAGC AGCAACAGCG CCCAGCGGCG 
GTTTCAAAAC AGTTCAAACA AAACGTTCAA GCTGACAAAA AAGCTACTGA AAAAAGTAAG 
CCATTAGCTA TTAAACCTTC GGCTGAAGGT AAGGTTTTTG TAAAGCGTTT TACCTTTTCT 
GGTTATGAGG GCACAGTGTC GCAAGATGAG TTGCAGAATA TGGTAAAGCC TTATGTTGGC 
AAGCAATTTA GTATGGAGCA ACTTGATGCG GTGTCTGCCA ATATCACTTC TGAGCTGCGT 
GCAAAAGGAT GGTTGGCATT AGCAACCCTT CCACCGCAAG ATGTTACCTC TGGTACAGTT 
CATGTGGCTA TTAACACTGG TAAAGCTGCC ATGACCTCTA TTACGAGCGA TGGATCAATT 
CGCATTTGCA AGCGTCCGCT TCGCCAAATT GCTGAAAAAA CCTGCCCTCC CGGTTCTCCC 
CTTAATACTA ATGATCAAGA GCGTGCTGTG CTTTTGATGA ACGATATTCC TGGTATTGCA 
GCCACCACAT CGCTTTCAAA AGGAATGCAG GCTGGTACTA CCGACGTTAA TTATCTCATT 
CACGAAGGTG CATTGCTTTC AGGCGTTTTG TGGGCTGATA ATTATGGCAA CCGCTACACT 
GGCTCGTTGA TGCAATATGC CGTGCTTAAT ATTAACGATC CTTTCCACTG TGGCGAGCAA 
ATTATGCTTA ATGCTGCTCA TTCGGCTGGT ATGTGGCGAG GTGGCGCGAA TTATAGCGTG 
CCAATGCCCT TCCTTTTTGC AGGTTTAACG GGTCATGCCG GTGTTTCGGG AATGCAATAT 
GAATTGCTTG AGGAGCTTGA AGTGCTTGAT TATAAAGGCA CGAGCGTTAA AGCTGATGCT 
GGGTTCAGTT ACGCTTTGCA TCGTAGTCGT AAAGCCAATC TTACCTCTGA TGTTTCCTAC 
ACATACAAAG GTTTAAAAGA CAGGATGAGC AACACCGATT TGCGTGATGG CACCATTCAA 
TTTGTAACCT TTGGTTTATC GGGAAATTAC CACGACGACC TCTTTTTTGG CGCTTTAACA 
ACGGCTGATG TAAGCATTAC TAAGGGTTCG CTTGATGAGA AAATTCGTGA TATCCACTTA 
AGCGGCGCTC AAGGTGGTTA CACGCGGTTT AATCTGGAGC TTACGCGTTA TCAGCGCTTT 
TCGGAACCTT GTGCACTCGA TCTCACTTTT TCTGCCCAAC ACACGTTAAA AAATCTTGAT 
AGCAGCGACA AATTCTACCT TGGTGGTCCA TACACTGTTC GTGCTTATCC GCTTGGTGAG 
GCGGCAGGCG ATCACGGTGC GCTCTTTAAG GCTGATTTAC GCCACCGCAT TCCTGTACCG 
GCTGAGTGGG GCGATATGTT TGTTAACGCA TTTTATGATG TGGGCCATGT TACACTCAAT 
AAAGATCGCT ATGCGGGTGA TTCGGCTACA ATGAACGCAA CTGGTAGTAA CGATTACTGG 
CTGCAAGGTG CGGGTGTTGG TCTCCGCTAC GATATTTCAG AAACCTTCAC CCTTCAAGGG 
TGCTGGGCGC ACACCATTGG CAAAAATTCT GGTCGCGCAT TTGATGGCAA TAACTCTGAT 
GGCAAGAGCG ATAATCATCG CTTTTGGGTT CAGGGACTTA TGAATTTCTA A

Protein sequence

MVPKIITSLV AGSVVFSASL QAAPLVPNAG SLQQQQRPAA VSKQFKQNVQ ADKKATEKSK 
PLAIKPSAEG KVFVKRFTFS GYEGTVSQDE LQNMVKPYVG KQFSMEQLDA VSANITSELR 
AKGWLALATL PPQDVTSGTV HVAINTGKAA MTSITSDGSI RICKRPLRQI AEKTCPPGSP 
LNTNDQERAV LLMNDIPGIA ATTSLSKGMQ AGTTDVNYLI HEGALLSGVL WADNYGNRYT 
GSLMQYAVLN INDPFHCGEQ IMLNAAHSAG MWRGGANYSV PMPFLFAGLT GHAGVSGMQY 
ELLEELEVLD YKGTSVKADA GFSYALHRSR KANLTSDVSY TYKGLKDRMS NTDLRDGTIQ 
FVTFGLSGNY HDDLFFGALT TADVSITKGS LDEKIRDIHL SGAQGGYTRF NLELTRYQRF 
SEPCALDLTF SAQHTLKNLD SSDKFYLGGP YTVRAYPLGE AAGDHGALFK ADLRHRIPVP 
AEWGDMFVNA FYDVGHVTLN KDRYAGDSAT MNATGSNDYW LQGAGVGLRY DISETFTLQG 
CWAHTIGKNS GRAFDGNNSD GKSDNHRFWV QGLMNF