Gene Cag_0721 details

Gene Information Plasmid Coverage information Fosmid Coverage information Sequence

Gene Information

Locus tag	Cag_0721
Symbol
ID	3747417
Type	CDS
Is gene spliced	No
Is pseudo gene	No
Organism name	Chlorobium chlorochromatii CaD3
Kingdom	Bacteria
Replicon accession	NC_007514
Strand	-
Start bp	995225
End bp	996238
Gene Length	1014 bp
Protein Length	337 aa
Translation table	11
GC content	40%
IMG OID	637773255
Product	hypothetical protein
Protein accession	YP_379035
Protein GI	78188697
COG category	[S] Function unknown
COG ID	[COG4804] Uncharacterized conserved protein
TIGRFAM ID

Plasmid Coverage information

Num covering plasmid clones	20
Plasmid unclonability p-value	0.259935
Plasmid hitchhiking	No
Plasmid clonability	normal

Fosmid Coverage information

Num covering fosmid clones	n/a
Fosmid unclonability p-value	n/a
Fosmid Hitchhiker	n/a
Fosmid clonability	n/a

Sequence

Gene sequence

ATGAGCAATG AGTTCGACAA ACAGTTGTTT CCGAACCTTG TTCAGATAAT TGAGCAGGGT 
AAAAAGCAGC TTGCCGTTCA GGTGAACAGC ACGATTGTGC TTACTTATTG GCAGGTTGGT 
AAAACCATCA ATGAGCACAT ACTCAATAAT GAACGTGCAG GCTATGCAAA AGAGATTGTG 
GCAACGGTGG CGACACAATT GGTTGAGCAA TTCGGTAAAA GTTTCGAAAC AAAAAACCTT 
TATCGAATGA TGCAATTTGC AGAGCTGTTT CACGATTTTG AAATTGTCGT TCCACTGGCA 
CGACAATTAA GTTGGTCGCA TTTTTTGGCA CTTTTGCCGT TAAAAAGCAA CGATGCCCGA 
ATATTTTATG CACAAAAAGC AATTGAAGCC AATTGGGGAA AACGAGAATT GCGCCACCAA 
ATAGATCGCA AAGCCTATGA ACGACAGGAA ATTGTAAACA CTCAACTTCA AAACACATCA 
GAATTTACCG ATGCAACAGG AGTTTTTAAA GACCCATATT TCCTTGATTT CCTTGGATTG 
AAAGATGGTT ACTTGGAAAA AGACCTTGAA TCTGCAATCA TCAAGGAACT CGAAAATTTT 
ATTTTGGAAT TAGGTAAGGG CTTTACGTTT GTGGAACGCC AAAAACGAAT GATAATAGAT 
GGGGAGGATT TTTATCTCGA CCTGCTGTTT TATCACAGGA AACTACAGCG ATTAGTAGCC 
ATAGAATTGA AATACGGCAA ATTTAAAGCT TCCTATAAAG GCCAAATGGA ACTGTATCTA 
AAATGGCTTG ACAAATACGA ACGCCATGAT AATGAAAACA GTCCGATAGG GTTAATATTG 
TGCGCCGGCA AAAGCAACGA GCAAGTCGAA CTTTTAGAAA TGCACAAAGA CGGTATAATG 
GTAGCAGATT ACTGGACAGA ATTGCCCTCT AAAGCCCAAC TTGAAAACAA ACTGCACCAG 
CTTTTAATCG AAGCCCGAAA CCGGATTGAA CAACGCAAAG CATTGGAAGA ATGA

Protein sequence

MSNEFDKQLF PNLVQIIEQG KKQLAVQVNS TIVLTYWQVG KTINEHILNN ERAGYAKEIV 
ATVATQLVEQ FGKSFETKNL YRMMQFAELF HDFEIVVPLA RQLSWSHFLA LLPLKSNDAR 
IFYAQKAIEA NWGKRELRHQ IDRKAYERQE IVNTQLQNTS EFTDATGVFK DPYFLDFLGL 
KDGYLEKDLE SAIIKELENF ILELGKGFTF VERQKRMIID GEDFYLDLLF YHRKLQRLVA 
IELKYGKFKA SYKGQMELYL KWLDKYERHD NENSPIGLIL CAGKSNEQVE LLEMHKDGIM 
VADYWTELPS KAQLENKLHQ LLIEARNRIE QRKALEE