Gene Cag_1604 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_1604
Symbol
ID	3746469
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	+
Start bp	2094445
End bp	2095620
Gene Length	1176 bp
Protein Length	391 aa
Translation table	11
GC content	39%
IMG OID	637774144
Product	hypothetical protein
Protein accession	YP_379902
Protein GI	78189564
COG category
COG ID
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	21
Plasmid unclonability p-value	0.562385
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGGCACTTC GTAAAAACAT AGGCGAATCA TACACGCCAA CATATTTTCT TGCATCGCTC 
GGTAACGGCG GCTTAGCGGT AACTTTTTTC ATGTTTCTTA TGTTCATGAT TCCGCATAAA 
GGTCGCCCTA TGCCCGTTTT TGAAGATATT GTTGCAGCAC TACAAAGCAC ACTCCCTATA 
CAGTTTTTAA CTATTGTAAG TCTTGTTGGA ATTATATGGT TTTCCGCACA ACATTATCGT 
ATGCTTATTT GGAACATTCG CCAATATCTT GCGTTTAAGC ATACCCCTGC ATTTAATCGC 
TTTCAAACAA CGGATGCACA AGTACAATTA ATGGCTATAC CGTTAACCTA CGCTATGGCA 
ATTAATGTCA TGTTTATTCT TGGTGCCGTG TTTGTTCCTC AACTTTGGAG TGTGGTAGAA 
TACCTCTTTC CAATGGCAAT GGGAGCCTTT TTTATTGTTG GTATTTACTC TATTTCTATT 
TTTTACACAT TCTTTTCACG AGTTATTGCG CACGGAGGCT TTGACTGCGA AAAAAACAAT 
AGCTTAAGCC AAATGCTTTC CATCTTTACC TTTTCAATGG TTGCTGTCGG CTTTGCCGCA 
CCAGGTGCTA TGAGCCACAA CGTGATTGTT TCAGGCGTAG GCATTATAAT GGCAACATTT 
TTTCTTGCAC TTGTAACAAC GCTTGGTGTT ATTAAAATTG TGCTTGGCTT TCGCTCTATG 
TTAGCTCACG GCATTAACTA TGAAGCTTCA GTTTCACTAT GGATTGTTAT TCCAATTCTT 
ACTCTTGTTG GAATTACTAT ATATCGTATT GCTATGGGAT TAGTGCATAA CTTTGATGCC 
GTTATCCATC CATGGGCGCA CGTTATTATG TTTACCGCCT TGTGTGGTAT TCAAATCTTT 
TTTGGGTTGT TGGGGTATGG CGTTATGAAA GAGCTTGGCT ACTTTAACGA ATTCATTCAT 
GGGGAAAGCA AAAGCGCTGT TTCATTTGCA GCAATTTGCC CGGGTGTAGC ATTTGTTGTG 
CTTGGCAACT TTTTTATTAA CAGAGGTCTT GTAGCCGCTG GACTTATTGA AATGTTTTCA 
GTTGCTTACT TTGTGCTCTA TATACCATTG CTTGCAATTC AAGCACAAAC CATTATTGTG 
TTAATGCGTC TTACGCGTAA GCTTTTAAAA GCGTAA

Protein sequence

MALRKNIGES YTPTYFLASL GNGGLAVTFF MFLMFMIPHK GRPMPVFEDI VAALQSTLPI 
QFLTIVSLVG IIWFSAQHYR MLIWNIRQYL AFKHTPAFNR FQTTDAQVQL MAIPLTYAMA 
INVMFILGAV FVPQLWSVVE YLFPMAMGAF FIVGIYSISI FYTFFSRVIA HGGFDCEKNN 
SLSQMLSIFT FSMVAVGFAA PGAMSHNVIV SGVGIIMATF FLALVTTLGV IKIVLGFRSM 
LAHGINYEAS VSLWIVIPIL TLVGITIYRI AMGLVHNFDA VIHPWAHVIM FTALCGIQIF 
FGLLGYGVMK ELGYFNEFIH GESKSAVSFA AICPGVAFVV LGNFFINRGL VAAGLIEMFS 
VAYFVLYIPL LAIQAQTIIV LMRLTRKLLK A